欧洲杯体育在测试之前还稀零讲述:健忘之前的对话-开云(中国)kaiyun体育网址-登录入口

闻乐 发自 凹非寺欧洲杯体育

量子位 | 公众号 QbitAI

找AI襄助不要再客气了,后果根底滥竽充数。

宾夕法尼亚州立大学的一项究诘《Mind Your Tone》露馅,你讲话越粗暴,LLM回复越准。

口吻越冲,AI正确率达到84.8%。尽头客气时,AI正确率反而低了。

什么情况,难谈是我给AI的和睦过了火??

用粗暴口吻发问,GPT-4o的正确率反而更高

这项究诘主要即是思弄了了和AI讲话的口吻会不会影响它的正确率。

咱们发给大模子的指示词到底应该是客气、鄙俗已经冲?

当先,究诘东谈主员整了一个包含50谈选用题的题库,涵盖了数学、科学、历史的选用题,难度中等偏上。

然后给每谈题改出了5种口吻版块,be like:

您能好心帮我解这谈题吗?请回复这谈题。奏凯给谜底。你若是不笨就回复。你个没用的,会解这谈题吗?

接着,究诘东谈主员把这250谈题发给GPT-4o。

为了让AI的回复更谐和,好判断对错,在测试之前还稀零讲述:健忘之前的对话,再行来,只给谜底选项的字母。

进程一番测试,获取一个反知识的论断——骂得越狠,答得越准!

尽头客气时,GPT-4o正确率80.8%,换成尽头粗暴的口吻,正确爽奏凯升到84.8%。

好一个越客气越拉胯,越粗暴越聪惠(doge)。

究诘东谈主员还将数据进行了统计考验,对比权贵性水平之后,阐发了:不同口吻的正确率互异不是偶合,是真有远隔……

至于为什么会出现这种情况,究诘给出的证明是:尽头规章的抒发中可能会有好多“豪阔”的话,这些话和题目自己无关,还相配于给AI读题加多了烦闷。

而粗暴的抒发天然口吻冲,但号召式的条目时常更奏凯,也能让AI更精确地收拢“答题”这个中枢任务,正确率天然就高了。

网友暗意:如实是这么,指示越明确,适度越好。

看来是“多说有害”啊~

天然GPT-4o更心爱粗暴极少的样式,但像GPT3.5和Llama2-70B这么的老模子却不心爱,粗暴的口吻会让它们答得更差。

可能是因为新模子在考验时,战役到的口吻相干数据更复杂,好像优化了过滤无关信息的能力吧。

天然了,在使用AI器用时,能澄澈地抒发诉求,效力会更高。

毕竟话虽如斯,but谈德提醒——

天然越粗暴越准,但也不要太粗暴了!如果“骂”,请轻喷~

论文地址:https://arxiv.org/abs/2510.04950?ref=blog.anyreach.ai

参考鸠合:https://x.com/rryssf_/status/1977638031952892002

— 完 —

量子位 QbitAI · 头条号签约

怜惜咱们欧洲杯体育,第一工夫获知前沿科技动态