ME News Новости, 17 апреля (UTC+8), согласно мониторингу 动察Beating, выпущены два обновления инструмента наблюдаемости LangSmith, принадлежащего платформе разработки AI-агентов LangChain: библиотека шаблонов оценщиков и повторно используемые оценщики. Оценка того, насколько «удобен» AI-агент — один из самых затратных по времени этапов разработки. Агент может вызвать правильный инструмент, но формат ответа неправильный; однопроходный диалог проходит нормально, а при многопроходном — происходит сбой; конечный ответ кажется разумным, но промежуточные шаги ссылаются на неправильные документы. Разработчикам приходится устанавливать контрольные точки на уровне отдельных шагов, полного траектории, многопроходных диалогов и вызовов конкретных инструментов, а каждый оценщик требует написания подсказок, калибровки с реальными данными и многократной настройки, что зачастую занимает несколько недель с нуля. Сейчас LangSmith предоставляет более 30 готовых шаблонов, охватывающих пять категорий.

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
TradfiTradingChallenge
236.31K Популярность
#
GrayscaleBuysAndStakesOver510KHYPE
8.92M Популярность
#
IsraelStrikesIranBTCPlunges
48.54K Популярность
#
#DailyPolymarketHotspot
1.01M Популярность
#
SpaceXOfficiallyFilesforIPO
751.82K Популярность

Закреплено

Карта сайта

Страхи перед запуском AI-агента наконец-то частично решены благодаря инструментам и связям

Популярные темы

TradfiTradingChallenge

GrayscaleBuysAndStakesOver510KHYPE

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

SpaceXOfficiallyFilesforIPO

Закреплено