本篇希望可以帮大家梳理两件事：

有哪些：大家可以调用的模型都有谁？

怎么选：对比AI助理可用模型差异优势

如何用：手把手教大家添加自定义模型

可用模型列表

在哪找？

模型列表及价格页面：点击查看

可使用模型包括来自以下品牌的最新模型：
✅ OpenAI：gpt-4o、gpt-4、gpt-4-all全系列模型同步更新
✅ Midjourney：AI绘画
✅ Claude：全系列编程最强
✅ Gemini：谷歌推出 Gemini 1.0/1.5 系列
✅ Suno：文生歌曲
✅ Luma：文生视频、图生视频

以及国内模型Kimi、阿里千问、百度千帆、质谱AI、DEEPSEEK、百川智能、零一万物、讯飞星火、字节豆包、商汤、langchain、腾讯混元等等均支持。

日常使用推荐

1. 【首推】功能最全：GPT-4-all

强大的多模态能力，集合官方GPT-4、GPTs、联网、数据分析、读图、绘图功能、code interpreter代码解释器一体，和官方体验完全一致。

2. 【日常】性价比最优：gpt-4o

速度超快，具有 128K 上下文，2023 年 10 月的知识截止点，gpt-4o-后边一般会跟日期比如 gpt-4o-2024-08-06 ，代表在2024年8月6日推出的版本，建议尽量选择更新的版本。

3. 【便宜】低到极致：gpt-4o-mini

GPT-4o Mini主打的就是便宜好用，该模型具有 128K 上下文与极低价格：

Input Tokens: $0.38/M tokens 每百万tokens
Output Tokens: $1.5/M tokens 每百万tokens

token与单词的换算比例大约为 1000tokens=750单词 ，也就是说大约输入100万tokens（75万单词），你需要消耗0.38美金，按照网站充值汇率1美金=2人民币，约0.76人民币（7毛6）；输出100万tokens（75万单词），你需要消耗1.5美金约3人民币，价格非常低廉。

4. 【编程】代码厉害：claude-3-5-sonnet-20240620

如果你有写代码的需求，建议使用Claude 3.5 sonnet，具有最先进的语言处理技术，支持200K上下文、可读取图片，擅长推理及代码。

5. 【识图】任意模型

大多数模型支持（除了gpt-4-all），把鼠标放在对话框左侧的上传图标上，可以看到上传图片、上传音视频后的处理方式，如上图显示：

上传音视频会自动调用whisper-1模型转文字
上传图片会自动调用vision模型进行查看和描述

6. 【转录】任意模型

大多数模型支持（除了gpt-4-all），把鼠标放在输入框左侧小话筒，你可以使用Whisper现场录制或即时识别。

7. 【TTS】文本转语音

借助OPEN AI强大文本转语音模型，你有两种使用方式：

1. 把AI回复的内容转为语音

只需要点击对话右侧三个小点，选择TTS文本转语音即可。

2. 把你输入的任何内容转换为语音

需要使用自定义的tts模型，然后输入任何内容，会自动生成音频，方便你在视频剪辑中使用。自定义模型的方法，请看本篇内容的最后的 添加自定义模型 部分，目前TTS模型建议选择以下两种：

tts-1-1106

tts-1-hd-1106

设定你喜欢的音色

打开【设置】界面，选择【模型】，点击右下角的 More ，选择一位TTS语音人物即可。

8. 【数据】数据分析：GPT-4-all

上传Excel或csv数据集进行数据读取、清洗、分析、可视化等工作。

如何添加自定义模型？

理论上在模型列表页面中你看到的所有模型都可以使用，配置方法很简单，我们这里以添加 tts语音模型 为例。

1. 复制模型名称

在模型列表页面，找到 tts-1-1106 ，并复制它的名称。

2. 打开设置-模型

回到AI助理页面，点击左下角齿轮打开【设置-模型】。

3. 输入自定义模型名称

在 自定义模型 的位置粘贴 tts-1-1106 ，点击【保存】即可。

tts-1-1106

4. 使用新模型

【新建聊天】后，点击上方模型名称，选择模型 tts-1-1106 开始使用。

其他所有模型自定义的方法都一模一样。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

模型对比 | AI助理那么多模型选哪个？