Claude 3.7 Sonnet и Claude Code: Новые горизонты ИИ

Claude 3.7 Sonnet

Сегодня мы представляем Claude 3.7 Sonnet — самую умную модель от Anthropic и первую гибридную модель для рассуждений. Она выдаёт мгновенные ответы или детальные пошаговые размышления, видимые пользователю. Через API можно точно настроить длительность её思考 (мышления).

Модель сильно улучшена в программировании и фронтенд-разработке. Вместе с ней выходит Claude Code — инструмент командной строки для агентного кодирования, доступный в ограниченном превью. Он помогает разработчикам делегировать сложные задачи прямо из терминала.


Доступность и стоимость

Claude 3.7 Sonnet доступен во всех планах (Free, Pro, Team, Enterprise), через Anthropic API, Amazon Bedrock и Vertex AI от Google. Режим расширенных размышлений работает везде, кроме бесплатного уровня. Цена прежняя: $3 за миллион входных токенов, $15 за миллион выходных (включая токены размышлений).


Claude 3.7 Sonnet: Единая философия рассуждений

Мы сделали Claude 3.7 Sonnet универсальной: она совмещает стандартную языковую модель и рассуждения. В обычном режиме — это апгрейд Claude 3.5 Sonnet, в расширенном — она рефлексирует, улучшая результаты в математике, физике, программировании и следовании инструкциям. Промпты работают одинаково в обоих режимах.

Через API можно задать лимит размышлений (до 128K токенов), регулируя скорость и качество ответа. Мы меньше фокусировались на конкурсных задачах, больше — на реальных бизнес-сценариях.

Тесты подтверждают лидерство в коде: Cursor хвалит работу с большими базами, Cognition — планирование изменений, Vercel — точность агентных процессов, Replit — создание веб-приложений с нуля, Canva — готовый код с отличным дизайном и минимумом ошибок.

Лидерство в бенчмарках

  • SWE-bench Verified: топ в решении реальных софтверных задач.
  • TAU-bench: лучший в сложных тестах с инструментами и пользователями.
  • Таблица сравнения: выделяется в инструкциях, рассуждениях, мультимодальности и коде. Режим размышлений усиливает математику и науку. Даже в тестах на Pokémon превзошёл всех.

Claude Code: Помощник разработчиков

С июня 2024 года Sonnet — фаворит программистов. Теперь Claude Code в превью усиливает их: ищет и читает код, правит файлы, пишет тесты, пушит на GitHub, использует терминал, держа вас в курсе.

Для нас он незаменим в тестах, отладке и рефакторинге. Тесты показывают: задачи, на которые уходило 45+ минут, решаются за один проход. Скоро улучшим надёжность инструментов, поддержку долгих команд, рендеринг и самосознание Claude. Цель — понять, как разработчики используют его, чтобы улучшить модели. Участники превью получат доступ к нашим инструментам и повлияют на будущее Claude.


Улучшения на Claude

Интеграция с GitHub теперь во всех планах: подключайте репозитории, чтобы Claude 3.7 Sonnet — лучшая наша модель для кода — помогала чинить баги, писать функции и документацию для ваших проектов.


Безопасность и ответственность

Claude 3.7 Sonnet протестирован с экспертами на безопасность и надёжность. Он лучше различает вредные запросы, сократив отказы на 45%. Системная карта описывает оценки по нашей политике масштабирования, риски (например, атаки через промпты) и меры защиты. Также исследуются плюсы рассуждений: понимание решений моделей и их достоверность. Подробности — в карте.


Будущее с Claude

Claude 3.7 Sonnet и Claude Code приближают нас к ИИ, который усиливает людей: глубокие рассуждения, автономность, сотрудничество. Мы ждём, что вы создадите с ними, и ваших отзывов для их развития.

Хронология: от помощника к пионеру. Пора исследовать!

Like this post? Please share to your friends:
Anthropic
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: