type
status
date
slug
summary
tags
category
icon
password
Last edited time
Mar 16, 2024 07:01 AM
大语言模型的一些动向
📝 主旨内容
GPTs :允许任何人创建定制版本的 ChatGPT。
GPT 商店:用户可在商店分享自己构建的 GPTs 并赚钱。
GPT-4 Turbo API:比GPT-4 更强,128k上下文,本地知识更新至2023年4月。输入和输出价格分别便宜3倍和2倍。1080×1080像素的图像输入成本为0.00765美元。
GPT-3.5 Turbo:新款16K上下文型号的输入和输出价格分别便宜3倍和2倍。微调版的输入和输出价格分别便宜4倍和2.7倍。
DALL·E 3 API:每生成一张图像的起价为 0.04 美元。
文本转语音 API:提供六种预设声音可供选择以及两种针对优化的模型变体。每1000字符起价0.015美元。
Whisper V3:新开源语音转文本模型和它的 API 即将到来。
Assistants API:专门用于构建的AI,提供了代码解释器和检索以及函数调用等新功能。
迄今最大、能力最强的人工智能模型 —— 谷歌 Gemini 发布
Gemini 是首个从头构建的多模态模型,可以实现跨文本、代码、图像、音频和视频的无缝理解。Gemini 1.0 从大至小拥有 Ultra、Pro、Nano (3.25B/1.8B) 三个尺寸。
Gemini Ultra 的性能优于如今所有模型,在 32 个广泛使用的学术基准测试中的 30 个表现出了最先进水平,并且是第一个在 MMLU (57 个学科) 上超越人类专家的 AI。
Gemini Pro 的性能与 Claude 2 相当,优于 GPT-3.5。
Gemini 能够原生生成图像,而不必依赖中间自然语言描述 (转述会导致信息丢失)。
Gemini 全型号的音频理解优于 Whisper。
今天开始 Bard 将由 Gemini Pro 的微调版本驱动。Pixel 8 Pro 将成为第一款运行 Gemini Nano 的手机。Gemini Ultra 目前正在接受安全评估还有人类反馈强化学习的进一步完善,将在明年初与提供尖端 AI 服务的 Bard Advanced 一同推出。
🤗 总结归纳
📎 参考文章
- 作者:ziuch
- 链接:https://ziuch.com/article/LLMs?target=comment
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。
相关文章