Новые миры образования: Трансформация обучения в эпоху искусственного интеллекта



Тестирование проводилось на коммерческих продуктах и открытых решениях. В нем принимали участие модели от OpenAI, Google, Sber, Yandex, Mistral AI, Alibaba Cloud и их производные. Модели от OpenAI зарекомендовали себя как наиболее эффективные, демонстрируя высокий уровень понимания контекста и способность к поддержанию содержательных диалогов, однако они показали слабые результаты в задачах, связанных с обеспечением безопасности генерируемого контента. Модели GeminiPro (Google) и GigaChat-Pro (Sber) также могут рассматриваться для использования в задачах, связанных с разработкой ИИ-тьютора. Внедрение остальных моделей пока возможно только ограниченно из-за низкого качества результатов в ключевых задачах.

В целом результаты тестирования дают положительные предпосылки для активного внедрения LLM в российское образование. Разработки ведущих мировых и российских компаний демонстрируют высокий потенциал, однако требуют дополнительной настройки для соответствия нормативным требованиям и образовательным стандартам. Повышению эффективности применения LLM могут способствовать мультиагентные системы, объединяющие преимущества разных моделей.