Сегодня мы представляем Claude 3.7 Sonnet — самую умную модель от Anthropic и первую гибридную модель для рассуждений. Она выдаёт мгновенные ответы или детальные пошаговые размышления, видимые пользователю. Через API можно точно настроить длительность её思考 (мышления).
Модель сильно улучшена в программировании и фронтенд-разработке. Вместе с ней выходит Claude Code — инструмент командной строки для агентного кодирования, доступный в ограниченном превью. Он помогает разработчикам делегировать сложные задачи прямо из терминала.
Доступность и стоимость
Claude 3.7 Sonnet доступен во всех планах (Free, Pro, Team, Enterprise), через Anthropic API, Amazon Bedrock и Vertex AI от Google. Режим расширенных размышлений работает везде, кроме бесплатного уровня. Цена прежняя: $3 за миллион входных токенов, $15 за миллион выходных (включая токены размышлений).
Claude 3.7 Sonnet: Единая философия рассуждений
Мы сделали Claude 3.7 Sonnet универсальной: она совмещает стандартную языковую модель и рассуждения. В обычном режиме — это апгрейд Claude 3.5 Sonnet, в расширенном — она рефлексирует, улучшая результаты в математике, физике, программировании и следовании инструкциям. Промпты работают одинаково в обоих режимах.
Через API можно задать лимит размышлений (до 128K токенов), регулируя скорость и качество ответа. Мы меньше фокусировались на конкурсных задачах, больше — на реальных бизнес-сценариях.
Тесты подтверждают лидерство в коде: Cursor хвалит работу с большими базами, Cognition — планирование изменений, Vercel — точность агентных процессов, Replit — создание веб-приложений с нуля, Canva — готовый код с отличным дизайном и минимумом ошибок.
Лидерство в бенчмарках
- SWE-bench Verified: топ в решении реальных софтверных задач.
- TAU-bench: лучший в сложных тестах с инструментами и пользователями.
- Таблица сравнения: выделяется в инструкциях, рассуждениях, мультимодальности и коде. Режим размышлений усиливает математику и науку. Даже в тестах на Pokémon превзошёл всех.
Claude Code: Помощник разработчиков
С июня 2024 года Sonnet — фаворит программистов. Теперь Claude Code в превью усиливает их: ищет и читает код, правит файлы, пишет тесты, пушит на GitHub, использует терминал, держа вас в курсе.
Для нас он незаменим в тестах, отладке и рефакторинге. Тесты показывают: задачи, на которые уходило 45+ минут, решаются за один проход. Скоро улучшим надёжность инструментов, поддержку долгих команд, рендеринг и самосознание Claude. Цель — понять, как разработчики используют его, чтобы улучшить модели. Участники превью получат доступ к нашим инструментам и повлияют на будущее Claude.
Улучшения на Claude
Интеграция с GitHub теперь во всех планах: подключайте репозитории, чтобы Claude 3.7 Sonnet — лучшая наша модель для кода — помогала чинить баги, писать функции и документацию для ваших проектов.
Безопасность и ответственность
Claude 3.7 Sonnet протестирован с экспертами на безопасность и надёжность. Он лучше различает вредные запросы, сократив отказы на 45%. Системная карта описывает оценки по нашей политике масштабирования, риски (например, атаки через промпты) и меры защиты. Также исследуются плюсы рассуждений: понимание решений моделей и их достоверность. Подробности — в карте.
Будущее с Claude
Claude 3.7 Sonnet и Claude Code приближают нас к ИИ, который усиливает людей: глубокие рассуждения, автономность, сотрудничество. Мы ждём, что вы создадите с ними, и ваших отзывов для их развития.
Хронология: от помощника к пионеру. Пора исследовать!
