Комментарий
797
9 июня 2025 11:02
Пути прогресса в ИИ: эффективность алгоритмов и роль данных

Смена парадигмы
Современное развитие ИИ сопровождается изменением приоритетов: вместо наращивания вычислительных мощностей всё больше внимания уделяется улучшению алгоритмов. Если раньше прогресс определялся доступом к высокопроизводительной инфраструктуре, то теперь в фокусе — оптимизация архитектур и методов обучения, позволяющая достигать высоких результатов при меньших ресурсах. На фоне исчерпания эффекта от масштабирования ведущие команды всё чаще делают ставку не на экстенсивность, а на эффективность.
В частности, одним из ключевых направлений становится повышение вычислительной экономичности моделей. Ряд новых архитектур демонстрируют примеры того, как можно отказаться от ресурсоёмких трансформеров в пользу более лёгких по структуре, но не менее продуктивных решений. Подобные модели показывают не только хорошую адаптацию к существующим задачам, но и высокий потенциал масштабируемости в условиях ограниченной инфраструктуры. Это открывает возможности для разработки конкурентоспособных ИИ-систем в институциональных и национальных контекстах, которые ранее воспринимались как периферийные — включая небольшие лаборатории, стартапы или страны без доступа к передовым вычислительным кластерам.
Не менее важным элементом алгоритмического прогресса становится переосмысление самой работы с данными. Подходы, основанные на предварительной фильтрации (data pruning) и синтетической генерации обучающих примеров, позволяют радикально сократить объёмы информации, необходимой для качественного обучения, не снижая при этом итоговой производительности моделей. Более того, в ряде случаев такие методы демонстрируют результаты, сравнимые с обучением на больших, традиционно собранных корпусах. Следовательно, данные всё чаще воспринимаются не как нейтральный ресурс, а как актив, подлежащий стратегической инженерной настройке. Такой сдвиг особенно значим в условиях, когда доступ к масштабным и разнообразным корпусам становится политически или экономически ограничен.
Отдельное внимание привлекает развитие подходов к переопределению целевых функций, используемых при обучении моделей. Господствующий сегодня критерий — минимизация кросс-энтропии — оказывается недостаточным для ряда задач, где от модели ожидается не просто статистически точный результат, но релевантный, адаптивный и социально понятный отклик. Именно в этом контексте усиливается интерес к методам постобучения, прежде всего к обучению с подкреплением на основе человеческой обратной связи (RLHF). Такие подходы позволяют встраивать в модель параметры, отражающие оценки качества, данные людьми, и тем самым настраивать поведение модели под реальные пользовательские ожидания. Несмотря на относительную дороговизну RLHF, уже сегодня он демонстрирует значительный потенциал, позволяя формировать модели, которые по качеству и функциональной пригодности сопоставимы с более крупными, но обученными по стандартным схемам системами.
Технологические траектории
В целом будущее ИИ всё чаще связывается не с универсальным вектором прогресса, а с несколькими возможными сценариями развития. Они различаются по механике технологического роста и по тому, какие акценты в них становятся определяющими.
Первый возможный путь — сценарий, при котором рост ИИ ограничен не столько техническими возможностями, сколько качеством и доступностью данных. Несмотря на объёмы уже собранной информации, её полезность для обучения моделей начинает снижаться: данные повторяются, насыщаются, не содержат новых смыслов. Исследования показывают, что значительная часть больших обучающих массивов может быть заменена на гораздо меньшие по объёму, но более тщательно отобранные наборы — без серьёзных потерь в качестве модели. Если эта тенденция сохранится, развитие крупных универсальных моделей может замедлиться. На смену им придут более компактные и специализированные системы, рассчитанные на узкие задачи, но работающие быстрее и эффективнее. Доступ к уникальным данным может стать ключевым активом и усилить позиции тех стран и компаний, которые обладают эксклюзивными архивами, отраслевыми регистрами или правом доступа к чувствительным пользовательским данным.
Во втором сценарии дефицита данных нет — напротив, технологии генерации синтетических и мультимодальных наборов информации продолжают развиваться. Однако узким местом становятся алгоритмы. Модели становятся всё более громоздкими, стоимость их обучения растёт, но прирост качества оказывается всё менее выраженным. Следовательно, эффективность от вложений снижается. Если этот сценарий реализуется, произойдет смещение интереса в сторону малых моделей, оптимизированных под конкретные задачи и работающих на меньших вычислительных мощностях. Для государств и компаний это означает необходимость переосмыслить инвестиционные стратегии и наметить курс на разумную эффективность и адаптацию.
Третий сценарий — наиболее перспективный, но и наиболее сложный в реализации. Он предполагает, что прогресс в алгоритмах и работе с данными будет развиваться параллельно и согласованно. Если улучшения в архитектурах совпадут с расширением возможностей по синтетическому формированию и отбору данных, станет возможным устойчивое масштабирование ИИ без сильного роста затрат. В этой модели выигрывают те, кто способен быстро интегрировать технологические новации, грамотно сочетать инженерные и научные ресурсы, а также выстраивать гибкие организационные и нормативные структуры. Такие игроки смогут быстрее адаптировать модели под прикладные нужды, выпускать более точные и надёжные ИИ-системы и при этом контролировать издержки.
Каждая из этих траекторий требует своего набора решений на уровне как корпоративного управления, так и государственной политики. Ограниченность данных ставит перед государствами задачу развития национальных информационных ресурсов. Сценарий перегрузки алгоритмов требует переоценки принципов финансирования и координации исследований. Сценарий согласованного роста — вызов для институциональной гибкости и способности оперативно внедрять новые знания.
Политические вызовы и ориентиры
Алгоритмический прогресс ставит под сомнение эффективность привычных инструментов технологического регулирования, таких как контроль за доступом к вычислительным ресурсам и передовым чипам. Рост эффективности алгоритмов делает экспортные запреты менее действенными: даже при ограниченном доступе к вычислительным ресурсам отставание может сократиться до одного-двух циклов технологических обновлений. Особенно ярко уязвимость аппаратных барьеров проявляется на примере Китая, где, несмотря на санкции, местные разработчики быстро адаптируют новые архитектуры и методы обучения, сокращая зависимость от крупных дата-центров. Это становится возможным благодаря открытому распространению академических знаний, публикаций и исходного кода, доступных даже в странах под санкциями. В результате политическое преимущество, основанное лишь на аппаратных ограничениях, оказывается временным, если не сопровождается системным анализом и прогнозированием алгоритмических трендов.
С учётом этого государства и наднациональные объединения сталкиваются с необходимостью переосмысления подходов к технологической безопасности: вместо фокуса на контроль оборудования требуется акцент на мониторинг механизмов, обеспечивающих эффективность ИИ без масштабных вычислительных ресурсов. Ключевыми становятся архитектуры нового поколения, методы оптимизации данных и инструменты настройки моделей с учётом пользовательских предпочтений, что требует перехода от традиционной инженерной разведки к институционализированной «технологической аналитике». В такой среде успех определяется не столько доступом к ресурсам, сколько способностью оперативно интерпретировать и внедрять алгоритмические новации, что, в свою очередь, требует гибкости институтов.
В дополнение к мониторингу и институциональной адаптации важным направлением становится переосмысление научной и образовательной политики: акцент смещается с финансирования вычислительной инфраструктуры и коммерческих моделей на поддержку фундаментальных исследований. Стратегическое преимущество будут получать те, кто инвестирует в развитие исследовательских школ и подготовку специалистов, способных создавать ИИ-модели с нуля, а не только адаптировать готовые решения. В условиях высокой технологической неопределённости государственная политика в сфере ИИ должна опираться не на жёсткие прогнозы, а на сценарное мышление, позволяющее учитывать разные траектории развития.
Виктория Совгирь, аналитик Центра политической конъюнктуры.
#ВикторияСовгирь
КомментарийКомментарий
аналитикАлександр Астафьев
19 июня 2025
Интервью
Технологии критических значений
Александр Сидякин
19 июня 2025
Новость
ИИ приводит к массовым сокращениям
Microsoft в ближайшие недели планирует уволить
несколько тысяч сотрудников, пишет The Wall Street Journal. Основной удар придется на отделы продаж. Эти меры связаны со стратегическим перераспределением ресурсов в пользу развития искусственного интеллекта.
