ИИ учится языкам: как люди вдохновляют искусственный интеллект

Аспирантка Лейденского университета Юйчэнь Лянь исследует, почему человеческие языки развиваются именно так, и ищет пути улучшения искусственного интеллекта. Ее диссертация была защищена 12 декабря.

«Языки постоянно меняются. Возьмите древнекитайский и современный мандаринский — разница огромна, — с энтузиазмом говорит Лянь о своем исследовании. — А между разными языками различия еще более существенны».

В то же время существуют универсальные характеристики, объясняет аспирантка. «Лингвисты стремятся понять, какие черты являются общими и почему они возникают. Благодаря возросшей вычислительной мощности в последние годы мы теперь можем изучать эволюцию языка с помощью компьютерных моделей во все более реалистичных условиях».

Искусственные мини-языки

Лянь завершила свою докторскую диссертацию под руководством Тессы Верхуф и Арианны Бисарра, при поддержке Китайского стипендиального совета. В рамках программы она провела три года в Лейденском университете, прежде чем вернуться в Китай для продолжения работы над диссертацией. «Я очень скучала по Лейдену, здесь прекрасная атмосфера. Я рада вернуться для защиты диссертации».

В своем исследовании аспирантка черпает вдохновение из мини-языков, используемых в лингвистических экспериментах с людьми. Участникам даются три слова: подлежащее, объект и глагол. Например: «кот», «мышь», «гонится». В различных заданиях исследователи наблюдают, как они используют эти слова. В английском языке, например, порядок слов фиксирован, объясняет Лянь. «Кот гонится за мышью» — единственно правильное предложение. А в японском языке после слов ставятся маркеры, указывающие на их функцию. Поэтому порядок слов там более гибкий.

Диалог между ИИ-агентами

Лянь моделирует двух или более ИИ-агентов, способных общаться друг с другом. Эти агенты сначала обучаются на заранее определенном искусственном языке, аналогично экспериментам с людьми-участниками. «Мы, по сути, даем им словарь в начале, — говорит Лянь. — Затем мы позволяем агентам взаимодействовать парами или даже группами в интерактивных языковых играх. Когда они успешно выполняют задачу, все агенты получают вознаграждение. Так они учатся».

Разные агенты могут иметь одинаковый словарь, но разные грамматические правила для анализа различных сценариев. Результаты показывают, что эти агенты могут воспроизводить компромисс между гибкостью порядка слов и использованием маркеров. «Значит, модель работает. Более того, она позволяет нам масштабировать результаты, полученные с людьми. Это хорошо дополняет эксперименты с участием людей».

Человеческий язык вдохновляет ИИ-чат-ботов

Лянь открыла новое направление для изучения эволюции языка. В то же время ее работа обладает потенциалом для улучшения ИИ. «Мы можем черпать вдохновение из человеческого языка и использовать это для улучшения результатов, например, ИИ-чат-ботов. В настоящее время они обучаются преимущественно путем пассивного воздействия огромных объемов данных. Но люди явно осваивают язык гораздо более интерактивным способом. Мои симуляции демонстрируют, что повторное общение может привести к более эффективным взаимодействиям и спонтанному появлению человекоподобных паттернов».

Компьютерный ученый в области лингвистики

«Моя тема выходит за рамки информатики, — размышляет Лянь о своей докторской работе. — Погрузиться в эту междисциплинарную область — непростая задача. Мы говорим на разных языках и имеем разные стандарты публикаций, например. Иногда мне было трудно, потому что эволюция языка не имеет истин в последней инстанции, предложения нельзя доказать в математическом смысле».

В то же время она нашла это сочетание и удовлетворяющим. «К счастью, мои научные руководители имели опыт в обеих областях. Я считаю, что для полного понимания эволюции языка крайне важно объединять информатику и лингвистику».

Лянь успешно защитила диссертацию 12 декабря. Аске Плат был основным научным руководителем, Тесса Верхуф и Арианна Бисарра — со-руководителями.

Комментарии

Комментариев пока нет.