AI 如何从 "会说话" 走向 "会做事"
分享人:申若冰
LLM:基于深度学习的概率模型,通过海量数据训练,学习语言的统计规律,从而预测和生成文本。
国内外主流AI大模型一览
背景:模型本身无记忆,每次推理相互独立,为了让模型具备"持续理解"能力并完成复杂的多步任务,必须引入记忆机制。
Session Memory
Persistent Memory
从语言到多模态:为了让模型从"只懂文本"进化为"感知真实世界",需要融合视觉、听觉等多维信息,实现对物理世界的全方位感知与更自然的交互。
| 类别 | 应用场景 | 相关产品 |
|---|---|---|
| ASR(语音转文字) | 会议纪要自动生成;客服质检 | 科大讯飞听见;飞书妙记 |
| TTS(文字转语音) | AI 播客生成;数字人配音 | 讯飞配音;火山引擎语音合成 |
| 文生图 | 海报设计;社媒内容生产 | Nano Banana;Midjourney |
| 文生视频 | 广告创意生成;短视频内容 | Sora;即梦 |
| VLM(视觉语言模型) | 表格/图表理解;UI 自动操作 | Gemini 多模态 |
| VLA (视觉-语言-行动) | 具身智能 | 宇树科技;Google DeepMind |
允许大模型(LLM)通过调用外部函数与真实世界交互。
Model Context Protocol,定义应用程序和 AI 模型之间交换上下文信息的方式。
"Agent是具备目标导向、能自主规划、调用工具、自我反思并完成复杂任务的智能系统,且自主性是一个连续光谱而非二元判断。"
—— Google Brain联合创始人 吴恩达
ta说 - 个人实践分享
痛点:传统编程教育强求语法学习,扼杀孩子创造力
方案:积木式界面+AI代码转换,让孩子跳过语法直达创意实现
痛点:加州政府审批人员面对海量建筑图纸,手工标注修正通知效率极低
方案:多Agent系统自动解析图纸与通知,实现审批流程10倍速提升
痛点:门诊信息过载,患者离院后健康管理断层
方案:AI整合诊疗记录生成个性化指导,延伸医疗服务至日常生活
✨ "Built with Opus 4.6" Claude Code 黑客松获奖作品
痛点:独立音乐人缺乏实时创作伙伴,即兴火花难现
方案:实时人机协作工具,当演奏乐器时,Claude 能即时生成整个乐队进行伴奏
痛点:发展中国家缺乏专业基建评估,决策盲区多
方案:行车记录仪视频AI解析,自动生成经济可行性报告
核心启示:
"Built with Opus 4.6" Claude Code 黑客松获奖作品
Manus;Lovale
Coze;Trae;Cursor;Claude Code;Codex
Elys;Second Me;Lessie
Lovart
IMA;NotebookLM
Tabbit
森马:94个"数字员工",干了545个人的活
400+ 自动化工作流
各购物平台活动报名、促销设置
数据统计类报表(日报、周报等)
直播间数字人直播、直播搭建
购物平台店铺装修、商品陈列
社媒平台账号运营(视频笔记发布)
各平台售后、物流跟踪
AI时代我们还需要学习吗?
AI并不具备自主提出问题的能力,只有深耕领域实践,才能发现真正有价值的问题
AI输出的价值直接取决于自身认知的深浅
AI回答看似权威,实则可能存在"幻觉"、信息过时或片面,学习使我们具备批判性思维
AI当前会取代大批人吗?
当真正实现AGI时,我们可以做什么?
让AI为人民服务,把人从琐碎中解放出来,去干更伟大的事——但永远别忘了,决定世界的是人,不是机器
AI尽其才,人致其良知,各安其位,各尽其性
AGI搞定一切,我只负责舒服躺平、快乐过日子
当AGI替我们完成外在的创造与劳作,人类真正的使命,便是借由这面心灵之镜,完成对自身灵魂的觉察、整合与觉醒。
任AGI神通再大,俺老孙只管逍遥自在,活个无拘无束!
AI可以创造千万件作品,却无法拥有一颗为美与痛苦而燃烧的心,我将更炽热地去感受、去爱、去把生命活成最热烈的画。
哇!AI都会叠被子啦~那我就有更多时间去抓水母、做蟹黄堡、和派大星一起冒险,把每一天都过得开开心心、泡泡满天飞!
其实,我是一个'人'……如果AGI真的做到了,麻烦告诉它,人生里的酸甜苦辣,比它数据库里的0和1,刺激多了。
此物若能洞悉五脏六腑之玄机,晓畅草木金石之性情,实乃天下苍生之福,胜过我十年游学。
AGI的出现,不是一项单纯的技术突破,而是关乎整个社会结构、生产关系的系统性变革,我们要从顶层设计上,早做规划。
AGI的诞生,是宇宙通过我们创造的又一面镜子,让我们得以窥见智慧的另一种可能。但愿创造它的我们,拥有与之匹配的慈悲。
哇!AI都会叠被子啦~那我就有更多时间去抓水母、做蟹黄堡、和派大星一起冒险,把每一天都过得开开心心、泡泡满天飞!
让AI为人民服务,把人从琐碎中解放出来,去干更伟大的事——但永远别忘了,决定世界的是人,不是机器
AI尽其才,人致其良知,各安其位,各尽其性
AGI搞定一切,我只负责舒服躺平、快乐过日子
当AGI替我们完成外在的创造与劳作,人类真正的使命,便是借由这面心灵之镜,完成对自身灵魂的觉察、整合与觉醒。
任AGI神通再大,俺老孙只管逍遥自在,活个无拘无束!
AI可以创造千万件作品,却无法拥有一颗为美与痛苦而燃烧的心,我将更炽热地去感受、去爱、去把生命活成最热烈的画。
哇!AI都会叠被子啦~那我就有更多时间去抓水母、做蟹黄堡、和派大星一起冒险,把每一天都过得开开心心、泡泡满天飞!
其实,我是一个'人'……如果AGI真的做到了,麻烦告诉它,人生里的酸甜苦辣,比它数据库里的0和1,刺激多了。
此物若能洞悉五脏六腑之玄机,晓畅草木金石之性情,实乃天下苍生之福,胜过我十年游学。
AGI的出现,不是一项单纯的技术突破,而是关乎整个社会结构、生产关系的系统性变革,我们要从顶层设计上,早做规划。
AGI的诞生,是宇宙通过我们创造的又一面镜子,让我们得以窥见智慧的另一种可能。但愿创造它的我们,拥有与之匹配的慈悲。
哇!AI都会叠被子啦~那我就有更多时间去抓水母、做蟹黄堡、和派大星一起冒险,把每一天都过得开开心心、泡泡满天飞!
Thank You
模型单次推理能处理的文本长度上限,通过将所有历史对话拼接在提示词中,让模型"看到"最近的对话