logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI降重实操指南 技术类内容重复超标解决方案

这篇文章专门解决你用生成式AI写技术笔记、博客初稿时,提交到平台后被判定为内容重复、甚至直接被标记为非原创的头疼问题。大部分人对AI降重的认知都停留在“改语序换同义词”的层面——放到普通文案里还行,放到技术内容里根本没法用,要么把专有名词改得面目全非,要么改完逻辑完全出错,反而得不偿失。我整理了自己大半年写技术博客攒下的实用方法,不用绕弯子,照着做就能把内容重复率压到平台要求的阈值以下,还不会出错

文章图片
#人工智能
AIGC生成开发内容的隐式故障根源拆解

所选结构:结构B 所选风格:风格32024年9月我翻完身边7个不同行业技术团队的三季度故障复盘表,发现有21起本该在单测阶段拦截的线上业务故障,根因完全来自AIGC生成的代码片段。这些故障的共性特别强:没有语法报错,常规功能测试全过,甚至代码风格比很多初级工程师写的还规整,但只要触发某条极端边界条件,直接就引发服务雪崩。有个做电商的团队甚至因为AIGC生成的正则校验漏了极端手机号的判断,导致支付接

文章图片
#AIGC
AI写作适配技术内容生产的底层逻辑拆解

拆解AI写作落地技术内容场景的底层逻辑,纠正认知误区,提升内容生产效率。

文章图片
#人工智能#深度学习#机器学习
【AI基础科普】ai检测报告是AIGC吗?别再把佐证材料当成违规内容了

如果你是学生或者研究人员,提交课程作业、毕业论文的检测报告,提前跟学校的审核老师说清楚,整份报告里只有最后几段的建议是AI生成的,核心的检测数据全是模型统计出来的,不存在报告本身是AIGC的问题。上周帮实验室研一的师弟审期末课程大作业,翻附录的时候看到厚厚一摞打印好的AI检测报告,他还特意用荧光笔标了“原创率92%”的字样,结果上周答辩刚走到答疑环节,老师一眼扫到报告就问他,这份ai检测报告是AI

文章图片
#人工智能
【AI技术解析】拆解AI检测原理:为什么你手敲的论文也会被误判?

但话说回来,很多写技术博客的人写多了,也会不自觉带这些大模型常用的套话习惯,比如写结论的时候总爱用很规整的句式,连转折词的选法都和大模型高度重合,我自己以前有几篇写算法教程的文章,传去检测的时候也出过70%以上的高风险,当时还以为我记忆错乱了搞混了自己是不是找AI代写过,后来删掉几个习惯性用的套话,加了两句我自己调参的时候踩的坑,数值直接就降下来了。普通人写东西思路是跳脱的,写着写着可能突然蹦出来

文章图片
#人工智能#机器学习#深度学习
【技术解析】AI论文检测原理全拆解

说白了这完全是外行的误解。我当时给那师弟的建议,根本不是让他去折腾什么奇奇怪怪的操作,而是让他把之前做文献调研时随手记的私人笔记翻出来,对着综述里的每一段,把当时选这篇文献的理由、哪篇论文的实验设计有他发现的小漏洞、后续研究的延伸方向这类只有他自己知道的内容插进去,前前后后补了1200多字的个人化表述,连半天时间都没用到,再去学校系统测,AI生成率直接降到7%,完全符合学校的要求,根本没花一分冤枉

文章图片
#人工智能
【AI工具科普】你真的搞懂AI检测工具的判定逻辑了吗?

第二个是句段分布熵,这个维度90%的免费检测工具都没做,我之前拆过几个开源的检测脚本,里面连统计句长分布的代码都没写。我当时给学弟调整内容的思路特别简单,根本没瞎换同义词,对着检测报告里标红的每一段低困惑度内容,一句一句换成带他个人专属实验经历的表述,比如原AI生成的“新能源汽车BMS系统的迭代速度近年逐步提升”,直接改成“我去年在实验室测这个功能的时候,连续刷了3版固件才把SOC估算的误差压到5

文章图片
#人工智能
到底了