ByteDance (TikTok) публикует свои модели искусственного интеллекта Seed-OSS с открытым исходным кодом

AndreyEx

8 месяцев назад

ByteDance (TikTok) публикует свои модели искусственного интеллекта Seed-OSS с открытым исходным кодом

Время чтения: 3 мин.

Как сообщается на VentureBeat, ByteDance, материнская компания TikTok, опубликовала две новые модели большого языка (LLM), Seed-OSS-36B-Baseи Seed-OSS-36B-Instruct, для продвинутых рассуждений. По заявлению компании, обе модели имеют открытый исходный код под лицензией Apache 2, и их можно найти на GitHub под эгидой их Seed Team.

Базовая модель Seed-OSS-36B доступна в двух версиях: одна с синтетическими данными, а другая без синтетических данных, в то время как Seed-OSS-36B-Instruct отличается от другой тем, что она посттренирована с использованием данных инструкций для определения приоритетов выполнения задач и выполнения инструкций вместо того, чтобы обслуживать исключительно базовую модель.

Seed-OSS-36B-база с синтетическими данными обучается с использованием дополнительных данных инструкций, что позволяет ей обеспечивать лучшие результаты в стандартных тестах производительности и в большей степени ориентирована на общую высокопроизводительную цель. Со своей стороны, версия без синтетических данных опускает эти дополнения, тем самым создавая более чистую основу, которая позволяет избежать искажений и искажений, вносимых синтетическими данными инструкций.

Разрешительная способность лицензии Apache 2 открывает двери для использования моделей практически в любом контексте, от бизнес-приложений до внутренних приложений компании или предназначенных для клиентов, и все это без каких-либо затрат для пользователей и разработчиков. использовать как сами модели, так и связанные с ними API. Seed Team позиционирует свои LLM для международных приложений, уделяя особое внимание универсальности рассуждений, выполнению задач аналогично тому, как это делал бы агент, и многоязычным средам.

Читать Вышла LibreOffice 25.2.5 с более чем 60 исправлениями ошибок

Начальная команда ByteDance подчеркнула доступность своих программ LLM для разработчиков и профессионалов, поскольку они могут быть реализованы с помощью Hugging Face Transformers с использованием 4-битного или 8-битного квантования для снижения требований к памяти. Кроме того, они также могут быть интегрированы с vLLM для масштабируемого сервиса, включая примеры конфигураций и инструкций для сервера API. Чтобы еще больше снизить барьеры, существуют сценарии для логического вывода, настройки подсказок, интеграции инструментов и других опций, позволяющих адаптировать реализации моделей к различным контекстам.

Модели ByteDance Seed-OSS-36B-Baseи Seed-OSS-36B-Instruct могут быть ответом на gpt-oss-120b и gpt-oss-20b, выпущенные OpenAI в том же месяце, оба из которых также доступны через один и тот же хостинг репозиториев и под одной лицензией. Фактически, учитывая, что у каждой компании свой подход, обе компании стремятся с помощью своих моделей с открытым исходным кодом расширить круг пользователей, снизив требования и расширив контексты, в которых они могут использоваться.

Похоже, что последние шаги в области искусственного интеллекта больше сосредоточены на доступности и на том, чтобы модели могли использовать как можно больше пользователей. Это имеет смысл, особенно если предполагается, что сектор будет продолжать расти. Однако все чаще раздаются голоса, осуждающие то, что вокруг искусственного интеллекта существует пузырь, который может лопнуть самым худшим образом, напоминая эпизод, известный как пузырь доткомов.