识别AI私家侦探,侦探公司,调查公司,查人找物,商务调查,出轨外遇调查,婚外情调查,私人调查,19209219596生成文本的方法

 人参与 | 时间:2026-03-23 07:12:45

考试和分数不该是学生生活的全部。除了关注分数之外,我还可以去留意窗前柳芽初萌;可以观赏天上的满月美景,并让后羿嫦娥、吴刚与玉兔的传说在心中流转;甚至可以前往盛装打扮过的西湖边骑行,在雨中淋一点雨,在风中吹几口风……然而,家长的教诲不容反驳:“你知道吗?中考差一分就不是一个操场的人了。”

这就是我的烦恼。

这些文字是AI生成的,还是由人撰写的?

我询问了7人,其中5人表示这些作品是由人工智能生成的。他们提到的主要原因是“辞藻堆砌”。

AI通用模型的文本生成能力不断进步,已经达到了人类难以精确辨别的水平。因此,不当使用这些模型可能导致的虚假新闻、学术失实现象和恶意产品评价等问题引起了广泛的社会关注。

据公安部网络安全局官方公众号消息,因使用AI捏造“顶流明星在澳门输了10亿”谣言,一名男子被行政拘留8日。 据介绍,3月10日,网民徐某强为博取流量、谋取非法利益,利用“某书”软件中的AI智慧生成功能,输入热点词后制作了“顶流明星被曝境外豪赌输光十亿身价引发舆论海啸”的谣言信息,并在网上发布。这些虚假信息迅速扩散开来,引发了大量网民讨论和关注,并导致相关话题频繁登上热搜榜,严重影响公共秩序。

2023年2月16日,“杭州市政府3月1日取消机动车尾号限行”的消息迅速流传开来。据浙江之声报道,在当天,杭州某个小区的业主群里讨论起ChatGPT一事。有一位业主开玩笑称尝试用ChatGPT撰写一篇“杭州取消限行”的新闻,并直播了其写作过程并把文章发到了群里。其他业主不明真相,于是截图后转发出去。

人工智能与人类智能——如何判断一篇文本的真假?

3月24日,西湖大学自然语言处理实验室博士生鲍光胜的研究小组开发出了一款名为Fast-DetectGPT的人工智能应用程序。当该团队向程序提供开头的“我的烦恼”这段文字后,程序迅速作出了判断:这可能是由AI生成的概率为19%。

它是对的。这些文字来自杭州一位七年级学生撰写的作文。

文本到底是出自人类构思的,还是由计算机生成的呢?或许人类难以准确区分,但这项任务可以交给AI来完成。这是研究者的想法。

Fast-DetectGPT 在开源模型 GPT-Neo 2.7B 上运行,无需训练即可识别各种 AI 大语言通用模型生成的文本内容。对于 GPT3.5 和 GPT4 的生成文本,识别率分别达到96%和90%,优于斯坦福大学在2023年提出的 DetectGPT。与 DetectGPT 相比,Fast-DetectGPT 的检测速度提高了 340 倍,并降低了75%的错误率。去年,以鲍光胜为第一作者、西湖大学工学院副院长张岳教授为通讯作者的研究论文,私家侦探,侦探公司,调查公司,查人找物,商务调查,出轨外遇调查,婚外情调查,私人调查,19209219596在2024国际表征学习大会上发表。

张岳于2003年从清华大学计算机科学专业毕业,随后在牛津大学取得了该专业的硕士和博士学位,并在剑桥大学从事博士后研究工作,现任西湖大学终身教授。他的主要研究方向包括自然语言处理、文本挖掘、机器学习和人工智能。 鲍光胜是张岳的博士生,在微软(中国)及阿里巴巴工作多年,三年前加入西湖大学。他们共同撰写的论文“Fast-DetectGPT在私有大模型扩展Glimpse的研究”,已于即将于新加坡举办的2025国际表征学习大会上收录发表。

澎湃新闻:关于AI生成的文字,当前主流的识别方式有哪些?

张岳提到的方法主要有监督分类器法、零样本分类器法以及水印法。使用监督分类器法需要收集大量的已知数据,其中包括AI生成的文本和人类创作的文本,并进行分类学习。对于训练中遇到过的大语言模型产生的文本识别准确率较高;但对于没见过的大语言模型生成的文本,则识别准确率会下降。

Fast-DetectGPT 和 DetectGPT 均采用零样本分类技术,在没有训练数据的情况下工作。它们主要依据 AI 文本中的特征识别相似对象。

水印法是在生成AI文本时打上“水印”。国家互联网信息办公室、工信部、公安部及国家广电总局已发布《人工智能生成合成内容标识办法》,将于9月起实施,并要求相关服务提供者对生成的合成内容添加显式标识,或在文件元数据中添加隐式标识。这种方法准确性高,但存在标记可能被人为削弱甚至完全移除的风险。

澎湃新闻:Fast-DetectGPT的工作原理是什么?

鲍光胜说,简单来说,人工智能更了解其他人工智能,Fast-DetectGPT“识别”出了类似的模型。

所谓的"生成"文本是指,机器依据前文内容挑选后续文字,选取标准基于词汇和句式在已有数据中的出现频率。频率越高,则被选用的可能性越大——就如同搜索页面下方闪烁的建议框。

Fast-DetectGPT 的工作基于一个前提:人类与 AI 通用模型在形成文本时有不同的选择。人类写文章时的选择较为多样,个体间的差异较大;而不同的 AI 通用模型之间的差异则不太显著——因为这些模型在语料库上预先训练,反映了集体写作行为的特点,生成文本时倾向于选择具有更高模型概率的词汇和句式结构。因此,两种文本在词汇使用、句子结构、语法复杂程度以及语义连贯性等方面存在区别。我们提取涵盖了这些特征差异的统计量“条件概率曲率”,分析两类文本中的分布情况。若被测文本的主要统计特征值落在 AI 生成文本的分布中,则可以认为该文本大概率是AI生成的。

不妨这么理解:对于Fast-DetectGPT而言,在分析待检测文本时,它会在保持原意不变的前提下进行改编。之后再将其生成的文本与原始文本进行比较。当待测文本确实是AI撰写的内容时,两者之私家侦探,侦探公司,调查公司,查人找物,商务调查,出轨外遇调查,婚外情调查,私人调查,19209219596间表现出较高的相似性。

张岳指出:人类思考具有因果性,来源于行为、反馈、后果和互动等具体元素,而通用模型侧重统计思维。写文章时,AI的选择依赖于学习现有数据,并通过词与词之间“共现性”的概率高低来预测下文。然而,AI缺少泛化能力,即无法基于训练集中的特定规则和因果逻辑推断出未被直接包含在训练数据中的内容。 这种写作方式与创造性的人类写作存在显著差异。

那么,“阿尔法围棋”(AlphaGo)为什么能连续展现出人类无法预料到的棋步?而在2016年韩国李世石九段在人机对战中仅有的中盘胜利是人类在番棋赛上的“最后一胜”,此后他再也没有赢得过与AlphaGo的比赛吗?

张岳:围棋的变化几乎无穷无尽,但结果只有两种,或是胜利或失败(平局极其罕见),弈棋规则非常明确。在这种情况下,AI程序的“算力”能够得到充分发挥。AlphaGo在训练中学习了几万份专业棋手的对弈棋谱,并进行了三千万盘自我对决。相比之下,保持高强度比赛状态的世界顶尖棋手,平均每年的职业对局不超过一百场;即便是加上训练对局和打谱,这些数字也完全不在同一量级上。

AlphaGo不会出现情绪变化,这是其在人机对局中的一大优势。相比之下,在写作领域内最为珍贵的部分可能是作者的情感体验以及内心的情绪变化。此外,“写得优秀”是没有界限的,这种进步是无法衡量完的。

澎湃新闻报道,Fast-DetectGPT在检测DeepSeek-v3生成文本时的准确率达到89%,但对DeepSeek-R1的检测准确率较低。我们注意到,类似R1的推理模型正在成为大模型发展的新趋势。关于Fast-DetectGPT会进行哪些优化和改进?

张岳指出,R1通过较长的推理链进行思考和规划,在生成文本内容时与其他通用模型有所不同。我们推测可能是因为R1在进行强化学习过程中探索了新的推理路径,这导致了输出分布的变化,并使得现有的检测器工作变得更加困难。

目前的Fast-DetectGPT演示版采用了开源的小型语言模型GPT-Neo 2.7B。之所以称为“小”,是因为其参数量仅有27亿个。如果采用性能更强大的671B满血版本DeepSeek-R1,理论上识别准确率会更高。

技术始终是把双刃剑,模仿和鉴别将会成为长期的“攻防战”。作为Fast-DetectGPT的私有大模型延伸版本,Glimpse能够检测26种语言的文本,并具有更高的识别精度。总体而言,AI模型生成的内容会越来越真实,而人类使用AI程序进行文本识别的能力也会不断提升。

顶: 782踩: 97292