Радостин Чолаков: На ти с компютрите
Когато разговаряш с Радостин Чолаков, е много лесно да забравиш възрастта му. Преди още да завърши гимназия, 16-годишното момче, участник в „30 под 30“ за 2021 г., е създател на платформата Azbuki.ML. Tя използва машинно обучение, за да коригира граматични и пунктуационни грешки, генерира текстове и осъществява гласов прочит на текстове на български език. Платформата си партнира успешно с „Просвета“ за електронните учебници на издателството. Наред с това Радостин е machine learning консултант в софтуерната компания Obecto.
Разговаряме онлайн. Радостин успява да ми отдели малко време, преди да отиде на училище. Той е ученик в XI клас в математическата гимназия „Акад. Кирил Попов“ в Пловдив, в паралелка по системно програмиране.
Радостин Чолаков прави първите стъпки в програмирането, когато е едва на 10. Родом е от родопското село Барутин. Майка му е шивачка, а баща му работи в дърводелски цех. Обучението си започва в Барутин. Когато е в V-VI клас, паралелките са смесени и учителите преподават на два класа в рамките на един час, но това не го спира да учи допълнително това, което му е интересно. Когато родителите му му купуват първия компютър, той започва да се учи сам да прави сайтове и игри. Чичо му е уеб дивелопър и докато им е на гости, от него за първи път вижда какво значи да програмираш. Продължава сам да се обучава и съвсем скоро започва да прави приложения – „минипроектчета, които аз и моите приятели да използваме като игри или за да си чатим и да си записваме някакви неща“. Едно от тях е приложение за игра на шах, към което има и уебсайт. „Беше солидно като опит в програмирането, защото доста неща научих.“
В VIII клас се премества в Пловдив и в математическата гимназия открива ученическите състезания по информационни технологии. Участва в състезанията в групата за XII клас и още тогава е сред лауреатите. „Моята идея винаги е била нещата, които правя, да са на добро ниво“, казва скромно по този повод Радостин.
Той е носител на множество отличия от национални и международни състезания, както и на две награди „Джон Атанасов“. Едни от последните му призове са от международни състезания в САЩ през май и в Нидерландия през септември. На Международния панаир на науката и инженерството Regeneron получава втора награда на Асоциацията за изчислителна техника в САЩ, а във второто – EU Contest for Young Scientists, организирано от Европейската комисия, печели втора награда.
На състезанията се представя с проекта си GatedTab Transformer – machine learning алгоритъм за анализ на таблични данни, който може да се използва в сферата на финансите, енергетиката, медицината, навсякъде, където има структурирана база данни. „Ако например имате лабораторни изследвания – стойности, числа на много хора и трябва да се постави етикет дали човекът е болен, или не е болен или пък дали страда от някаква болест, алгоритъмът ще се научи кои стойности допринасят за поставянето на този етикет и когато му дадете ново изследване, автоматично ще го поставя.“
И в двете състезания освен представянето на проект журито търси дали е подплатено с необходимата научна база и изпитва участниците върху тяхната подготовка по темата. „За мен беше признание на световно ниво, че проектите, които правя, са сравними с тези на най-добрите ученици в света на тази възраст, които също правят стартъпи“, казва момчето.
Въпреки че за много ученици онлайн обучението по време на ковид пандемията е труден период, в който трябва да променят изцяло начина си на учене, което несъмнено се отразява и на постигнатите резултати, за Радостин Чолаков този период носи добра възможност да се отдаде още повече на страничните проекти, с които се занимава, включително GatedTab Transformer, с който се явява на състезанията през 2022 г. Подготовката в гимназията му дава достъп до състезанията, но необходимите знания – теоретични и практически, получава отделно, в свободното си време, обяснява той.
ПО ВРЕМЕ НА ПАНДЕМИЯТА СЕ РАЖДА И ПЛАТФОРМАТА AZBUKI.ML – през септември 2020 г. „Разработвайки различни неща, съм виждал доста интересни чатботове, които могат да ти отговарят по някакви комплексни въпроси, а в много международни издания на медии има възможност да ти бъде изчетен текст. Всякакви такива малки инструменти, които толкова ти улесняват ежедневието, свързано с езика, но на български няма кой знае каква поддръжка в големите платформи.“
Тръгвайки от това, той създава съвкупност от компютърни програми за обработка на българския език, които могат да се използват в различни посоки. За да осъществи това, получава помощ от Института по информационни и комуникационни технологии и Института за български език към БАН, включително събрани от тях бази данни.
Върху тази основа той разработва инструменти с различни приложения. Един от тях може да прави синтактичен анализ на изреченията. Инструментът се харесва много на лингвистите, с които работи Радостин. Освен това той има и практическа насоченост. Може да се използва например от компании, които съставят документи със стандартизирана форма.
Друга негова разработка под шапката на Azbuki.ML е гласов синтезатор на български език. Това не е първият такъв синтезатор, но Радостин прави подобрения. „Реших, че може да направим предпроцесинг стъпка, която прави промени, за да звучи текстът по-добре и да се коригират грешки. Могат да се слагат ударения на думи или да се коригира интонация в изречение. Софтуерът използва базата данни, за да разбере кои са думите, при които най-често се греши, и автоматично ги заменя, без да има нуждата да се намесва редактор.“
Софтуерът се оказва много полезен на издателство „Просвета“, по-конкретно за платформата им с електронни учебници. „Таргетирахме го за по-малките ученици и за тези, които имат някакъв тип затруднения в зрението или социалните умения. Идеята е текст да може да се изчете с този подобрен глас, с който сме експериментирали. И преди са опитвали да правят подобно нещо, но поради зле звучащите синтезатори са се отказали от тази идея. За малките деца може дори да е стряскащо“, обяснява Радостин Чолаков. „Успях да си изпълня визията за това да се използва от истински компании“, казва той.
Идеите, които реализира в Azbuki.ML, са припознати от още двама души, специалисти в сферата на базите данни, които се свързват с него в социалните мрежи и предлагат да му помагат в разработките. Първоначално се включват на доброволни начала, но в момента са вече формално част от екипа на платформата.
Част от разработките му в Azbuki.ML му помагат и при работата му за софтуерната компания Obecto. С основателя Тодор Колев се запознават по време на състезание по информационни технологии. Колев го кани да разработва в компанията проекти, свързани с machine learning модели, като в част от времето може да прави проучване, което да използва след това по време на участията си в състезания. Колев му помага и по време на разработването на GatedTab Transformer.
В Obecto Чолаков използва разработките си в Azbuki.ML за един от проектите, по които работи. Става въпрос за чатбот платформа. Целта е да може да генерира по-добре звучащи отговори, когато чатботът говори с клиент. Другият проект е платформа за анализ на борсите за биткойн, етериум и други, за да се автоматизира купуването и продаването на токени.
Питам го как успява да съчетава работата си с училището. „Една идея по-спокойно вече“, казва с усмивка той. Причината е, че учи в паралелка по системно програмиране и от тази година отпадат много предмети като история и география. Все пак признава, че има часове, в които му е скучно, защото „започваме от нулата неща, които съм правил в IV клас“. Затова се е разбрал с учителите в часовете да работи по странични проекти.
Трябва да приключваме интервюто, защото Радостин трябва да си напише домашните преди училище. Не мога обаче да не го попитам какви проекти го очакват от тук нататък. „Аз мисля, че висшето образование е важно – казва той. – Не е важно толкова формално – че ще отидеш някъде и ще научиш нещо. Ти, ако искаш да го научиш, ще го научиш. Искам да уча на някакво по-престижно място заради сферата, хората, с които ще се запозная, обстановката. Това е важното – хората, с които ще общуваш, защото, когато всички са добри, и ти ще си по-мотивиран да си на ниво. След това, познавайки тези хора, когато се опитваш да създадеш бизнес или научна група, имаш хора, които да поканиш, и да знаеш, че всички те ще бъдат полезни. Или те да те поканят.“
Затова следващата му стъпка е да го приемат в престижен университет в Западна Европа или САЩ. Не смята да изоставя и настоящите си проекти в сферата на машинното обучение. „Те са приложими навсякъде. Ако едно време не са се получавали много неща, защото не е имало много данни, върху които да се обучават алгоритмите, вече има и моята визия е да се развивам в тази сфера“, казва той и бързо добавя: „Паралелно на или след университета.“