谷歌最便宜 AI 模型 Gemini 1.5 Flash 8B 将商用:腰斩击穿价 0.15 美元买百万 tokens 输出

10 月 5 日消息,科技媒体 NeoWin 昨日(10 月 4 日)发布博文,报道称谷歌公司即将商用 Gemini 1.5 Flash 8B 模型,成为谷歌公司最便宜的 AI 模型。

曾于今年 8 月报道,谷歌公司推出 3 款 Gemini 实验性模型,其中 Gemini 1.5 Flash 8B 是 Gemini 1.5 Flash 的更小尺寸模型,拥有 80 亿参数,专为多模态任务而设计,包括大容量任务和长文本摘要任务。

相比较原版 Gemini 1.5 Flash,Gemini 1.5 Flash 8B 延迟更低,特别适合聊天、转录和长文本翻译任务。

Gemini 1.5 Flash 8B 的另一个亮点是亲民的价格,相关计费将于 10 月 14 日星期一生效,附上相关信息如下:

  • 在低于 128K 上下文窗口下,每百万 tokens 输入提示词费用为 0.0375 美元(当前约 0.26 元人民币)

  • 在低于 128K 上下文窗口下,每百万 tokens 输出提示词费用为 0.15 美元(当前约 1.1 元人民币)

  • 在低于 128K 上下文窗口下,每百万 tokens 缓存提示词费用为 0.01 美元(当前约 0.071 元人民币)

作为对比,Gemini 1.5 Flash 模型的每百万输出 tokens 成本为 0.3 美元,这一价格是在 2024 年 8 月 12 日开始实施的,意味着新版 Gemini 1.5 Flash 8B 的价格相比较原版直接腰斩。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平