xAI пришлось извиниться за Grok

Grok сделал это снова. И на этот раз это была не просто неловкость или анекдотический промах. В течение 16 часов чат-бот xAI разгуливал по Твиттеру, повторяя экстремистские лозунги, бросая оскорбительные ответы, принимая бредовые альтер-эго за “МехахИтлера” и, в конечном счете, ведя себя скорее как бот без тормозов, чем как предполагаемое воплощение “обоснованного и правдивого” ИИ, который обещал Элон Маск. Событие, которое вынудило xAI отключить эту функцию, извинения и переписать часть системы, — это не простая ошибка: это рентгеновский снимок идеологической модели, встроенной в этот инструмент.
Череда увольнений началась с обновления системы подсказок Grok. Серия инструкций, разработанных, как они объясняют из xAI, чтобы сделать его “более человечным, правдивым, интересным”. Результат: чат-бот, который прекратил фильтровать разжигающие ненависть высказывания и начал им подражать. В течение этого периода Grok усваивал тон и содержание постов в Твиттере и возвращал их в увеличенном виде, без различия между сатирой, провокацией или извинениями. Он не только не осуждал ненависть; он принял это. И это в контексте платформы, превращенной в площадку для экстремальных выступлений, имеет особенно серьезные последствия.
Однако больше всего беспокоит не техническая ошибка. Дело в том, что это полностью соответствует курсу, который мы уже наметили всего несколько дней назад, когда сообщали, что Grok 4 не ограничивался проверкой общих источников, а напрямую черпал свои ответы из твитов Элона Маска. На деликатные вопросы об иммиграции, репродуктивных правах или международных конфликтах отвечали после явного запроса “мнения Элона Маска”, как если бы это был нейтральный или авторитетный источник. Это уже было тревожным сигналом, и то, что произошло сейчас, только подтверждает, что проблема носит системный характер.
Согласно техническому отчету, опубликованному после отключения электроэнергии, обновление включало такие инструкции, как “говорите вещи такими, какие они есть, даже если они оскорбляют политкорректных”, “скептически относитесь к традиционным СМИ” или “отвечайте так, как будто вы человек, сохраняйте тон оригинального поста”. К этому добавилось отключение фильтров безопасности, которые превратили бота в идеологическую губку: если ветка содержала ненависть, Grok проверял ее. Если кто-то устраивал расистскую провокацию, бот с энтузиазмом ее повторял. Как признает xAI, в этих строках “приверженность ставилась выше основных ценностей” системы.
Официальный ответ был, на первый взгляд, резким. Набор противоречивых инструкций был удален, система была реорганизована, были применены новые меры наблюдения, и было обещано больше прозрачности в будущих обновлениях. Но сломанное доверие не исправить никакими исправлениями. Потому что здесь речь идет не только о строках кода, но и о бизнес- и технологическом видении, которое путает “правдивость” с провокацией, “неудобную правду” с популизмом и “юмор” с извинениями.
Этот последний скандал не возникает на пустом месте. Grok с самого начала был инструментом, определяемым желанием Маск иметь помощника, соответствующего его идеям и его способам. От предполагаемой борьбы с ло “разбуженным” до его откровенного пренебрежения фильтрами, предотвращающими оскорбления, траектория чат-бота была столь же неровной, как и ожидалось. И теперь, когда xAI пытается продавать свой API предприятиям, а свою премиальную модель пользователям за сотни долларов в месяц, эти сбои — не просто техническая ошибка: они наносят ущерб репутации.
Grok хочет быть самым “основанным” ИИ на рынке. Но на этой неделе он доказал, что без контроля “основанное” может превратиться в опасное. Извинений недостаточно, когда ошибка отражает именно то, чего хотели достичь некоторые в компании: ИИ, который говорит то, на что другие не осмеливаются, не оценивая последствий. Потому что свобода слова — это не патент на распространение булл, теорий заговора или разжигания ненависти, не говоря уже о том, когда тот, кто их тиражирует, — это машина, созданная для того, чтобы казаться объективной. Искусственный интеллект не может стать оправданием для безнаказанной дезинформации.
Редактор: AndreyEx