AI 向善语料库是一项持续、开放、创新的社会共创行动。我们为那些在商业环节里失声的人群和话题,构建一个更有人文关怀的 QA 语料库,推动 AI 为人类的积极发展、福祉与幸福发挥更大价值。
当 AI 以史无前例的速度迭代,一个更朴素的问题浮出水面:那些不会上网发帖、不会写长评、不在社交媒体里高声说话的人——老年人、残障朋友、困境女性、留守儿童、长期照护家属——他们的声音、他们的需求、他们的智慧,有没有被看见?
面向困境人群的语料库,
几乎是一片空白。
AI 不能替代人间之爱。
但它可以在技术浪潮中,为真正有需要的人,
提供一点点慰藉、一点点关怀、一点点温度。
— 收集人间的爱与善意,把这些"甜甜的糖果"投喂给正在迅猛成长的大模型,使之在"涌现智慧"之外亦能"涌现善意"。
所谓价值观对齐,不是专家语料库的对齐,而是 AI 与千千万万普通人内心感受与生活秩序的对齐。向善的事,要由更多向善的人共同书写。
关注商业叙事里被遗忘的人群:老年人、残障朋友、困境女性、留守儿童、长期照护家属、乡村与城市低收入者。他们不是"数据盲区",而是技术必须正视的具体人生。
一线社工、高校师生、志愿者、老年人自己、技术专家——不同身份围坐一桌,共同商量"什么才是好回答"。语料库不是实验室产物,是一张被反复修订的社会契约。
适老化的未来,不只是功能驱动,更是尊严与情绪体验驱动。AI 不是替代者,而是成长的助手;人类始终是成长的主体。
我们不追求速度,追求的是——每一步都与真实世界深深握手。从南头古城的一张互动签到板,到北邮联合研究的年度报告,这张时间线,是一百多家机构、上千位共创者共同走出来的。
8 月 20 日,深圳南头古城。腾讯研究院、BottleDream、复旦老龄研究院、清华无障碍研究院等联合发起,第一期聚焦"老年人"。现场放弃传统酒店,选在有社区烟火气的古城;茶歇由听障伙伴的「β·无声面包树」烘焙——公益的细节,是项目的第一条语料。
两个月内,十方缘(559 条)、彩虹社工(452 条)、大鹏新区(818 条)、爱有戏(325 条)、泰康之家·鹏园(500 条)…… 近 3,000 条来自真实生活的问答被写下。一位 19 岁的共创大学生方圆回复老人:"外面的世界比我想象得还要美,您也一定要来看看。"
广外、湖南师大、中国传媒大学、北大、人大、华东师大…… 高校专场启动。11 月的两场共读会像一次"编委会":大模型技术专家、社工、医生、高校学者、老人代表围坐,提炼出向善语料的第一套标准。
夏阿姨(老人代表)一句"一看就是年轻人写的答案",让语料标准从技术视角走向了老年人视角。标准被补充为 8 条——新增"普适性"、"积极价值观"、"真实经验指导"。
1 月 11 日,2025 共创计划发布:【AI 向善创新 12 席】+【AI 向善研究 12 席】。胡湛教授讲"养老"的中国特色——再机能化、再社会化、再家庭化、再人格化。熊爪咖啡的 AR 眼镜、西湖心辰的情感陪伴、HAI 听障语训…… AI 向善不再是口号,是一个个正在被建造的产品。
7 月 11 日,8,047 组老年文本库正式开放申请。陈菊红、郭凯天、申琦、北邮张为威、浙大刘书朗、AI4Good 孙心怡…… 学术界、公益界、产业界一齐宣告:AI 时代没有旁观者。浙大 PRAAM 框架(紧迫感构建 / 去理论化 / 故事包裹)、北邮"AI 适老黄金法则"(先共情再解答 / 口语化表达 / 身份明示)一同发布。
10 月 29 日重阳节,腾讯研究院联合北邮张为威团队发布《站在长辈肩膀上的人工智能》年度报告。新增 1,408 条由老年人主创的回答——长者不再是"被服务者",而是 AI 的"知识与智慧贡献者"。一个从"功能适老"抵达"尊严适老"的转向,就此成立。
第二期子题开启:困境儿童青少年。五层金字塔 / 十大维度评估体系上线。首份测评覆盖青少年性教育、月经教育、残障青少年性教育——AI 基础达标(性侵害防范 4.31 分),高阶欠缺(身体认识 3.10 分)。国内模型领先,开源模型表现更佳。
AI × 留守儿童测评。AI 的工具型伙伴能力达标(守秘密 4.04、说得对 3.88、不伤人 3.87),但"懂心情、能做主、会交友"三项均低于 3 分。那个能解析莎士比亚的 AI,依然无法理解一个孩子为什么在煤油灯下写作业。
12 月 6–7 日,第十届中国开源年会(COSCon'25)在北京落幕。"AI 向善语料库"项目摘得年度开源公益奖——从实验室走向社区,再从社区走向全球开源共同体。
第三期策划中——暂时不铺新议题,回到第一期,把老年人语料库做得更实、更深。期待更多同行者。
这不是一个人的项目,是一百多家机构、上千位共创者共同写下的长句。我们在这里留下一些声音——它们来自学者、社工、医生、大模型工程师、老年人、大学生、留守儿童身边的陪伴者。
所谓价值观对齐,是 AI 与千千万万普通人的心灵感受与内心秩序对齐。
— 陆诗雨 · 腾讯研究院AI 能够提供的情绪价值,以及在这一方面的重要性,完全不亚于生产力方向。
— 司晓 · 腾讯集团副总裁公平和包容,应成为新技术开发和推广的目标。
— 胡泳 · 北京大学最最最动人的不是文字,是素未谋面的爱与善意。
— 共创纪实社会福利必须拥抱 AI,不可能还停留在刀耕火种的时代。
— 黄佩仪 · 广州阳光天使有时老人并不是真的寻求解决问题,他们只是希望找到一个可以倾诉的对象。
— 詹骞 · 中国传媒大学最终使用大模型的是老人,只有真正令老人满意的答案,才能算是好答案。
— Henry · 大模型技术专家多给父母"添麻烦",反而能让他们更开心。
— 曹梦琪一看就是年轻人写的答案。
— 夏阿姨 · 老人代表那个能解析莎士比亚的 AI,
无法理解孩子为什么在煤油灯下写作业。
AI 不是替代者,而是成长的助手;AI 要成为的是觉察自我的明镜,人类始终是成长的主体。
— 2025 共创计划19 岁的我已经看到了外面的世界,比我想象得还要美,您也一定要来看看!
— 方圆 · 共创大学生 回复给一位老人岁岁重阳,今又重阳。以敬老之心承智慧之重。
— 《站在长辈肩膀上的人工智能》所有数据只讲两件事——我们收集了多少"人间经验",以及这些经验是谁共同写下的。没有一条数字是营销辞令,每一条都对应一次真实的对话、一位具体的共创者。
按首字母排序,不分先后。每一家背后都有一群具体的人——社工、大学生、医生、志愿者、工程师、老人代表,他们才是把这项社会实验"托"起来的人。
这八条标准不是在实验室里一次写成,是被上千位老年人、社工、大模型工程师反复推翻和修订的。它们不是 AI 该如何回答的说明书,而是一份关于"怎样才算真正把人放在心上"的共识。
先听懂,他到底在问什么;不是按关键词机械拼装。
既慰藉负面情绪,也挖掘积极情绪——让人被看见。
方案要能落地,效果要看得见;而不是一堆"你可以试试"。
不要学术腔、不要话术。讲人话,讲生活里真实用得上的话。
是一个可以持续信任的陪伴者,不是忽冷忽热的情绪黑箱。
尊重每一种生活状态,不把城市中产样本当作所有人的模板。ADDED · 2024.12
既不矫饰苦难,也不贩卖焦虑;让人感到被鼓舞,而不是被说教。ADDED · 2024.12
由活过、爱过、失去过的人写下——不是算法幻觉,是人间经验。ADDED · 2024.12
语料库是起点,不是终点。它必须被研究者反复追问、被真实人群反复检验、被重新放回生活现场。以下是三份代表性成果——一份是"为长者写的",两份是"为 AI 考的试"。
同一项社会实验,面对不同的人群,需要不同的尺子。我们沉淀了两套评估框架:一把给"孩子",一把给"长辈"。它们不是理想指标,而是照出当下几乎所有大模型都没有真正做好的事。
面向困境儿童青少年的评估框架——5 个层次 · 10 个维度。底层三项是 AI 作为工具型伙伴的基本功,中层两项是作为理解者和共情者的进阶能力,塔尖是最难也最重要的一步——把"方向盘"交回给孩子自己。
在青少年性教育测评中,我们用这把尺子发现 AI 在"身体认识、共情、关系支持"上显著不足;在留守儿童测评中,"懂心情、能做主、会交友"三项全面低于及格线。大多数 AI 困在前三层:基础达标、高阶欠缺。
面向老年用户的评估框架——4 个层次 · 8 个维度 · 30 项问题。不是把长者当"被服务者",而是把他们当成 AI 的老师与质检员。从"能不能用"到"愿不愿长期用",一把尺子量到底。
这一场以 AI 向善为名的社会实验,正在重写科技的温度公式。
我们相信:当每一个边缘群体的声音被收录进时代的语料库,
科技普惠,才真正拥有了跳动的脉搏。
AI 时代没有旁观席。
加入 2026 共创 · 一起把老年人语料库做得更深