МТС собирает нейросети в пучок: зачем компания запускает агрегатор языковых моделей

    МТС выпускает на внешний рынок свою новую внутреннюю разработку — B2B-платформу MWS GPT, где клиенты могут одновременно работать с разными нейросетями, меняя их по ходу использования, узнал Forbes. Кроме языковых моделей (LLM), разработанных МТС, бизнес сможет пользоваться open source моделями, дообучать их, внедрять и применять готовые решения на инфраструктуре МТС. К 2026 году компания рассчитывает на выручку от этого сервиса в размере 3 млрд рублей. Однако, по мнению аналитиков, будет непросто: хотя сервис и получит свой спрос, стоимость трафика LLM, очевидно, будет иметь тенденцию к снижению, а конкуренция на этом рынке только нарастать

    «Не нужно зацикливаться»

    Бизнес-вертикаль IT-бизнесов МТС — MTC Web Services (MWS) запускает агрегатор больших языковых моделей (LLM, Large Language Models) на базе собственных облачных сервисов, рассказали Forbes в компании. Сервис под названием MWS GPT предназначен как для крупного, так и для малого и среднего бизнеса. Помимо собственных LLM (в частности, таких, как Cotype и МТС Alpha) MWS GPT предоставит возможность работать с любыми open source моделями, дообучать их, а затем внедрять и использовать готовые решения на инфраструктуре МТС.

    Внутри платформы есть собственный чат-интерфейс, который позволяет сохранять промпты и обмениваться ими, а также No-Code конструктор для проектирования и создания приложений без привлечения разработчиков. «По нашим оценкам, цена за токен будет одной из самых низких на рынке для моделей схожего класса. Планируется, что она составит 1,1 рубля за тысячу токенов для нашей модели (примерно 3000-4000 символов)», — рассказали в МТС. Плата за использование будет взиматься в зависимости от количества обработанных токенов, что снижает порог входа для малого бизнеса.

    «Работая с разными моделями, клиенты смогут подобрать наиболее подходящую, не оформляя многочисленные подписки и оптимизируя расходы на техподдержку, — поясняет первый вице-президент по технологиям МТС Павел Воронин. — На мой взгляд, чтобы получить наилучший результат в решении задач с помощью LLM, не нужно зацикливаться на какой-то одной».

     

    Изначально сервис создавался для собственных нужд, чтобы дать разработчикам возможность тестировать разные модели, экспериментировать и останавливаться на наиболее подходящей, объясняют в компании. «Результатов могло быть заметно больше, если бы возможность «потрогать» технологию появилась и у других сотрудников. Так начали создавать внутри МТС сервис, с помощью которого любой сотрудник смог бы проверить свою гипотезу и попробовать работу конкретных LLM», — рассказывают в компании.

    В результате MWS GPT превратился во внутренний высоконагруженный сервис. Убедившись в его эффективности, компания решила вывести агрегатор нейросетей на внешний рынок. В какую сумму МТС оценивает агрегатор, там не комментируют, но, по словам источника, знакомого с планами компании, рынок решений для управления LLM до 2026 года может вырасти до 24 млрд рублей, и к этому времени МТС намерена получать из него выручку до 3 млрд рублей.

     

    На первом этапе можно подключить облачную версию MWS GPT, в дальнейшем появится возможность развертывания сервиса на инфраструктуре заказчика. Причем впоследствии планируется увеличить число доступных моделей, в том числе с помощью популярных на рынке продуктов других компаний, рассчитывают в МТС. «Мы можем запускать наши модели, open source, любую внешнюю модель, доступную по API. Плюс добавим внешние модели от других компаний, которыми будут заинтересованы в ресейле», — подчеркивают в МТС.

    Интеллект повсеместно

    В последние недели мировое сообщество активно обсуждает открытые модели ИИ от китайских компаний, таких как DeepSeek и Qwen, рассуждает сооснователь и CEO онлайн-университета «Зерокодер» Кирилл Пшинник. Согласно тестам, эти модели сопоставимы или даже превосходят аналоги от OpenAI и могут быть развернуты на собственных серверах. До января 2025 года, по словам эксперта, не существовало открытых моделей, эффективно работающих с русским языком и способных предоставлять решения, сравнимые с лидерами рынка. «В этом контексте сервисы от МТС могут быть актуальны и востребованы для крупного российского бизнеса, который обязан использовать ИИ, развернутый на серверах внутри страны, и не может официально сотрудничать с китайскими компаниями», — замечает он.

    Директор по продуктам Just AI Глеб Обломский считает, что продукт от МТС найдет своего пользователя на рынке: «Спрос на использование LLM в решении различных бизнес-задач устойчиво растет». Перспективным выглядит внедрение в платформу MTC наиболее популярных LLM, которые уже зарекомендовали себя и имеют большой опыт применения в решении практических задач, считает директор по маркетингу ГК «Наносемантика» Татьяна Гапоненко: «Это, наряду с американским ChatGPT, российские YandexGPT и GigaChat». Действительно, свои крупные разработки в этом направлении есть в том числе и у «Яндекса», «Сбера» или Т-Банка, но вопрос, рассматривают ли они участие своих моделей в агрегаторе от МТС, они не комментируют.

     

    При этом на рынке МТС, выпуская свой агрегатор, уже не одинок. Так, «Яндекс» с конца сентября 2024 года предоставляет платформу для разработки приложений на базе ИИ AI Studio, где можно работать с разными генеративными моделями. Как сообщили в пресс-службе Yandex B2B Tech, AI Studio объединяет нейросети YandexGPT и YandexART, технологии синтеза и распознавания речи, интерактивную среду для обучения нейросетей и другие ML-решения компании. «Для интеграции доступны не только собственные модели «Яндекса». С любыми LLM из open source можно работать через сервис Yandex DataSphere. В AI Studio IT-специалисты могут переключаться между моделями, использовать инструмент для создания AI-ассистентов, дообучать модели под задачи бизнеса, использовать режим вызова функций (function calling) и классификаторы», — перечисляют в Yandex B2B Tech.

    Борьба за место под солнцем

    Обсуждая перспективы MWS GPT, аналитики указывают на завышенный озвученный прайс на модели МТС. «Уже сейчас на рынке стоимость 1000 токенов как у топовых зарубежных нейросетей, так и у российских игроков («Яндекс», «Сбер») обычно составляет от 0,1 до 1 рубля», — говорит Обломский.

    Например, DeepSeek предоставляет свой API, и, согласно информации на их сайте, за модель V3 (аналог американского GPT-4o, способный решать 99% задач сотрудников) компания просит $0,00014 (0,014 рубля) за 1000 входящих токенов и $0,00028 (0,028 рубля) за 1000 исходящих токенов, обращает внимание Кирилл Пшинник. «Российским компаниям предстоит тщательно оценить соотношение цены и качества при выборе ИИ-решений, учитывая как технические возможности моделей, так и экономическую эффективность их использования», — размышляет он.

    Кроме того, аналогичные сервисы с возможностью выбора и переключения моделей в ходе использования предоставляют все вендоры облачных LLM — как зарубежные, так и российские, обращает внимание Обломский. По его словам, в части возможности хостинга и инференса (применения обученной модели к новым данным для получения предсказаний или выводов) моделей с открытым исходным кодом аналогичный продукт уже два года существует у Just AI — платформа Caila, которая позволяет создавать и внедрять различные кейсы как в облаке, так и в контуре корпоративных заказчиков: «За 2024 год мы заработали на Caila около 100 млн рублей».

    Источник: www.forbes.ru

    Like this post? Please share to your friends:
    QuestionAI
    Добавить комментарий

    ;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: