技术拆解:AI如何“蒸馏”一个人的认知框架——以张雪峰.skill为解剖样本

2024年,一种名为“skill”的AI产物开始走红网络。顾名思义,这是一种可运行的技能模块——通过采集特定个体的公开数据,将其思维模式和决策逻辑“蒸馏”成可调用的数字资产。 技术拆解:AI如何“蒸馏”一个人的认知框架——以张雪峰.skill为解剖样本 IT技术

技术溯源:从语料库到认知操作系统

从技术实现来看,“张雪峰.skill”的构建路径并不复杂。首先需要确定训练数据的边界:张雪峰已出版的书籍、公开演讲、媒体采访内容,均属可追溯的公开语料。开发者通过“蒸馏”过程,将这些文本中的决策模式提取出来,形成一套可运行的思维框架。 技术拆解:AI如何“蒸馏”一个人的认知框架——以张雪峰.skill为解剖样本 IT技术

关键在于“认知操作系统”这个定位。与简单的语录合集不同,skill追求的是一种可推理、可对话的智能体。用户输入问题,skill会调用训练好的逻辑链路,给出符合原始人物风格的回答。这种能力源于大语言模型对语言模式的学习,而非对真人思维的完整复刻。 技术拆解:AI如何“蒸馏”一个人的认知框架——以张雪峰.skill为解剖样本 IT技术

值得注意的技术细节是,AI生成的回答会整合最新信息。例如当用户询问“最吃香的专业”,skill不仅引用张雪峰的历史观点,还会结合4月的新闻动态给出判断。这说明skill具备动态信息整合能力,而非静态的语料检索。

边界厘清:数据来源、授权状态与使用场景

技术可行性并不等同于法律合规性。法律界普遍的判断是:张雪峰已故,其人格权益——包括姓名权、肖像权、名誉权——由家属继承。未经授权,以其名义生成回答,构成对人格权的侵害。

关键分歧点在于“以谁的名义”。如果skill仅作为研究工具,用于分析张雪峰的思维方式,或许尚在可接受边界内。但如果声称“我就是张雪峰”,则明显越界。

更复杂的场景是“同事.skill”。如果训练数据来源于工作场景的邮件、文档,这些内容的所有权归属存在争议。一方面,员工在职期间产生的工作成果通常归属雇主;另一方面,个人表达风格本身难以被完全“资产化”。这种模糊地带,亟需制度层面的明确。

技术本质:风格拟态与主体性缺失

从认知科学角度分析,当前skill技术本质上是“风格拟态”——通过大量样本学习,模拟特定人物的输出模式。这种模拟可以达到极高的相似度,甚至让用户产生“正在与真人对话”的错觉。

然而,风格拟态不等于思维等价。更关键的问题是:已故者失去了与自身副本对话的能力。在世者可以通过后续言行动态修正AI对其的认知,但已故者无法做到这一点。这种不可逆的信息差,决定了对已故者的skill化需要更严格的伦理审查。

技术创造者的判断值得关注:即使是同一开发者制作的skill,也承认“蒸馏不了直觉”“捕捉不了突变”。这种坦诚的局限性声明,恰恰说明当前技术的边界所在。

制度需求:谁在制作、谁在获益、谁在缺席

科幻作家孔欣伟在其作品中写道:“语言无法触及全部存在。”这句话揭示了skill化进程中的根本悖论:我们在用语言材料训练AI,而生命的意义恰恰存在于语言无法描述的部分。

更深层的不平等在于:有能力主动参与自身编码的人是少数。多数人缺乏技术认知和资源,无法对“被做成skill”这件事发表意见、行使同意权。这种结构性失衡,不能依赖行业自律解决,必须有约束力的制度规范介入。

技术本身并不中性。谁来制作、谁来获益、谁在缺席、这个副本最终服务于谁——这四个问题的答案,决定了每一个skill化行为的伦理站位。