Skip to content

第一次发起聊天

提供商配好之后,发第一条消息只是"按一下发送键",但聊天页里其实藏了附件、工具、思考开关、模型切换、会话搜索、消息导出等大量功能。这一页带你跑通最小闭环,再逐项告诉你每个按钮在哪里、点了会怎样。

新手必读

跑通第一条消息

回到「聊天」Tab。如果你按照前面教程走过来,现在屏幕上应该是这样:

  • 顶部导航栏:左上角菜单图标(汉堡键,打开会话列表)/ 中间显示「新的对话」/ 右上角可能有模型测试入口
  • 中间一大块空白(这就是会话区,还没消息)
  • 底部:输入框(占位文字写「Message」)+ 左侧加号(附件按钮)+ 右侧发送按钮

顶部如果显示"选择模型以开始"

说明你还没设定「当前模型」。回到「设置 → 当前模型 → 模型」选一个,再回来。

最简的第一条消息:在输入框里打"你好"两个字,按发送。

如果一切正常:

  1. 你的消息立刻以气泡形式出现在右侧。
  2. 左侧出现 AI 的气泡,文字逐字流式涌出。
  3. 流式结束后,气泡下方可能出现耗时、Token 数等小字(取决于你的设置)。

看到 AI 流式回答出来就成功了

第一条不工作时怎么排查

按以下顺序检查:

现象真实原因修复
顶部写「选择模型以开始」没设当前模型设置 → 当前模型 → 模型
发送按钮变灰点不了输入框为空 / 没选模型检查上面两项
弹窗"鉴权失败"API Key 错或过期第一次配置提供商 重新检查 Key
弹窗"连接失败" / 超时网络无法直连厂商给提供商开代理;或换网络
弹窗"模型不存在"模型 ID 写错或这个 Key 没开通用「从云端获取」重新拉模型列表
出回答但被中途截断模型方限速 / 超出上下文等几分钟重试;或在偏好设置里调小"最大历史消息数"

输入框周围都有什么

底部输入区从左到右、由上到下,元素是:

元素长什么样作用
加号(附件按钮)输入框左侧的 +弹出附件菜单:图片、相机、语音、文件
输入框圆角矩形,占位文字 Message打字处。支持多行,按回车换行而不是发送
工具开关输入框上方/下方一排小图标临时开关本轮对话用的工具,详见下文
发送按钮输入框右侧蓝色圆形箭头点一下发出。也可以长按以触发"带选项发送"(见进阶选项)

加号附件菜单里的五个选项

+ 之后会从底部弹出菜单(来自 ChatViewTelegramComposer):

选项系统图标干什么
选择图片photo从相册挑图片当作多模态输入。需要你选的模型支持视觉。
拍照camera调起系统相机现拍一张。
录制语音waveform现场录一段音频附件。
从录音备忘录上传music.note.list选系统"录音"App 里已有的录音。
选择文件doc从「文件」App 选任意文件(PDF、TXT、JSON 等)。

模型必须支持

  • 图片附件需要视觉模型(GPT-4o、Claude 3.5 Sonnet、Gemini 系列等)
  • 语音附件需要支持音频输入的模型(GPT-4o Audio、Gemini 系列)

模型不支持时附件会被忽略,AI 看不到内容。

切换模型

聊天页右上角点开模型选择器,会列出所有"已启用"状态的模型。选定后只对当前会话生效——不影响其他历史会话用什么模型。

如果你想给每个新会话设一个默认模型,去:设置 → 当前模型 → 模型

看看 AI 是怎么"想"的

ETOS LLM Studio 支持有「思考」能力的模型(GPT-5、Claude 4 系列、DeepSeek R1、Gemini Thinking 等)。当 AI 在思考时,气泡里会出现一个可折叠的灰色「思考过程展现」区域,里面是模型的推理草稿。

  • 想自动展开:设置 → 显示与体验 → 背景与视觉 → 「自动预览思考过程」打开
  • 不想看:折叠按钮收起来即可

让 AI 的回答能朗读出来

每条 AI 气泡长按或右键会弹出操作菜单,里面有「朗读」。第一次朗读需要先配 TTS 模型:

设置 → 对话行为 → 语音朗读(TTS) → 选 TTS 模型

可用的 TTS 模型来自你已经配好的提供商(OpenAI 的 tts-1 / tts-1-hd,或任何 OpenAI 兼容的 TTS 端点)。

导出整个会话或单条上下文

每条消息的长按菜单里有「导出整个会话」「导出到此消息(含上文)」两个选项:

选项干什么适合谁
导出整个会话把这条会话从头到尾导出想完整存档
导出到此消息(含上文)只导出到当前这条为止的内容想分享某个片段或做"截断"

导出格式支持 PDF / Markdown / TXT,按"分享"sheet 选保存到「文件」App 或发给别人。

进阶选项

工具开关(本轮临时启用)

输入框附近有一排小开关图标,对应:

  • 联网搜索 / Web 工具(如果当前模型支持)
  • MCP 工具(如果你接了 MCP 服务器)
  • Skills(如果你导入了 Agent Skill)
  • 快捷指令工具(如果你绑定了 iOS Shortcuts)

这些开关只影响下一次发送,按完即用即关。要全局启用 / 禁用某类工具,去对应的设置入口:工具中心、MCP 工具集成、Agent Skills、快捷指令工具集成。

多模态:发图片 / 语音 / 文件

完整流程:

  1. + → 选择对应附件类型
  2. 选完会在输入框上方出现缩略图(图片)或波形条(音频)或文件卡片
  3. 想取消单个附件,点缩略图右上角的 ×
  4. 输入框里还是可以同时打字——文字会和附件一起发出
  5. 按发送

多张图:再次点 + 选「选择图片」可以多选,所有图会一起发。

创建分支

如果你想从某条历史消息开始"假设另一个方向"——比如让 AI 用不同语气重写,可以从那条消息的长按菜单选「创建提示词分支」。

会弹出对话框「创建分支选项」,让你选:

  • 仅分支提示词:只复制系统提示词,不带消息历史
  • 仅复制消息历史:复制到这条消息为止的全部内容,包括 AI 的回答

新分支是一个独立会话,不会影响原会话。

在会话列表里搜索

左上角菜单图标打开会话列表,顶部有搜索框(占位文字「搜索会话标题或消息」)。它支持:

  • 标题模糊匹配
  • 消息内容全文搜索——能直接搜到某条历史消息的关键词

搜索结果里点击某条会直接跳到那条消息所在位置("消息序号定位")。

把会话整理到文件夹

每条会话长按 → 选「移动到文件夹」。文件夹可以在会话列表顶部新建。同一条会话同一时刻只能在一个文件夹里,但跨文件夹移动随时可以。

上下文(历史消息)长度

模型不会看完你的整段历史——会按规则截断只送最近若干条。这个数值在:

设置 → 对话行为 → 偏好设置 → 「最大历史消息数」

默认值是一个均衡数值。减小可以省 Token,但 AI 会忘得更快增大让 AI 记更多,但每次请求成本变高

实在搞不定可以做的事

  • 检查请求是否真的发出:在「设置 → 拓展功能 → 调试」里查看本地请求日志,能看到完整发出去的 URL、Header、Body
  • 临时切换提供商:如果怀疑当前提供商出问题,回设置切到另一个再试
  • 重置当前会话:长按会话 → 删除,重新建一条干净的

下一步

聊天能稳定收发了 → 界面导览,进一步认识各个设置入口

或者跳着看你最感兴趣的模块: