闻乐 发自 凹非寺欧洲杯体育
量子位 | 公众号 QbitAI
找AI襄助不要再客气了,后果根底滥竽充数。
宾夕法尼亚州立大学的一项究诘《Mind Your Tone》露馅,你讲话越粗暴,LLM回复越准。

口吻越冲,AI正确率达到84.8%。尽头客气时,AI正确率反而低了。

什么情况,难谈是我给AI的和睦过了火??
用粗暴口吻发问,GPT-4o的正确率反而更高这项究诘主要即是思弄了了和AI讲话的口吻会不会影响它的正确率。
咱们发给大模子的指示词到底应该是客气、鄙俗已经冲?
当先,究诘东谈主员整了一个包含50谈选用题的题库,涵盖了数学、科学、历史的选用题,难度中等偏上。
然后给每谈题改出了5种口吻版块,be like:
您能好心帮我解这谈题吗?请回复这谈题。奏凯给谜底。你若是不笨就回复。你个没用的,会解这谈题吗?接着,究诘东谈主员把这250谈题发给GPT-4o。
为了让AI的回复更谐和,好判断对错,在测试之前还稀零讲述:健忘之前的对话,再行来,只给谜底选项的字母。
进程一番测试,获取一个反知识的论断——骂得越狠,答得越准!
尽头客气时,GPT-4o正确率80.8%,换成尽头粗暴的口吻,正确爽奏凯升到84.8%。
好一个越客气越拉胯,越粗暴越聪惠(doge)。
究诘东谈主员还将数据进行了统计考验,对比权贵性水平之后,阐发了:不同口吻的正确率互异不是偶合,是真有远隔……
至于为什么会出现这种情况,究诘给出的证明是:尽头规章的抒发中可能会有好多“豪阔”的话,这些话和题目自己无关,还相配于给AI读题加多了烦闷。
而粗暴的抒发天然口吻冲,但号召式的条目时常更奏凯,也能让AI更精确地收拢“答题”这个中枢任务,正确率天然就高了。
网友暗意:如实是这么,指示越明确,适度越好。
看来是“多说有害”啊~
天然GPT-4o更心爱粗暴极少的样式,但像GPT3.5和Llama2-70B这么的老模子却不心爱,粗暴的口吻会让它们答得更差。
可能是因为新模子在考验时,战役到的口吻相干数据更复杂,好像优化了过滤无关信息的能力吧。
天然了,在使用AI器用时,能澄澈地抒发诉求,效力会更高。
毕竟话虽如斯,but谈德提醒——
天然越粗暴越准,但也不要太粗暴了!如果“骂”,请轻喷~
论文地址:https://arxiv.org/abs/2510.04950?ref=blog.anyreach.ai
参考鸠合:https://x.com/rryssf_/status/1977638031952892002— 完 —
量子位 QbitAI · 头条号签约
怜惜咱们欧洲杯体育,第一工夫获知前沿科技动态