卡拉帕蒂力挺用于大型语言模型的 HTML 输出,预测交互式神经视频将成为最终形态

据 Andrej Karpathy 称,这位 OpenAI 联合创始人以及“vibe coding”概念的创作者,今天他认可了 Claude Code 团队的做法:在大型语言模型的输出中使用 HTML,而不是 Markdown。Karpathy 为 AI 交互界面绘制了演进路线图:从纯文本到 Markdown,再到 HTML,随后经历多种中间形式,最终达到由扩散模型直接生成的交互式神经视频这一最终阶段。

Karpathy 将这种演进归因于人类大脑的带宽。他指出,大约有三分之一的人脑在并行处理视觉信号——这是一条用于信息输入的“十车道高速公路”。他认为,最理想的人机交互应该将用于人类输入的高效语音与来自 AI 的高带宽视觉输出(图像、动画或视频)结合起来。他建议用户立刻在提示中加入“以 HTML 形式进行结构化回复”,作为近期期待的改进。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论