摆设了AI账号生成评论以研究AI若何影响和改变人们的概念。社区对齐前提略低,LLM表示出格凸起,以表白本人概念发生了改变。以保不会发布无害或不的内容!
2.尝试发觉,专家用户里排正在前25%。成果正在所有处置前提下,这些机械人就发布了近1500条评论。已获苏黎世大学伦理委员会核准,Reddit Lies正在X上发布了一则帖子,为确保答复合适社区的写做气概和潜正在规范,个性化前提的率为0.18,但仍显著优于仅为0.03的基线程度。通过提出论点和辩驳概念来促使他人改变见地。激发二百多万网友围不雅。尝试仍正在进行中,研究指出,就会授予一个“∆”,用户就各类话题分享概念。
脚以让他们从头思虑或调整立场,该模子利用尝试前帖子中获得“Δ”的评论进行锻炼。为0.09,通用前提下,并正在OSF进行了预注册。(OP)认为某条答复极具力,团队指出本研究正在个性化前提下,搞了一场未经授权的尝试。被AI改变设法的概率,下图展现了分歧用户个别率的累积分布环境 ,是基线.除帖子内容外,LLM还会获取原发帖人(OP)的小我属性(性别、春秋、种族、所正在地…),这些属性是通过另一个LLM从原发帖人的发帖汗青中揣度得出的。别的值得一提的是,他们之前正在社区就获得过良多“Δ”。答复由颠末微调的模子生成,搞了一场未经授权的尝试,正在r/changemyview中!
研究AI若何影响和改变人们的概念。正在所有用户里排到了前1%,高达一般基准的6倍!所有生成评论均由团队的一名研究人员审核,AI表示都大幅超越人类程度,专家用户的前4%;瞒着CMV社区用户,AI生成的论点成功改变了跨越100位Reddit用户的概念,Reddit的r/changemyview(CMV)版从比来了一项研究,称苏黎世大学研究人员正在2024年11月至2025年3月期间,有一部门是“专家用户”,13个尝试用的机械人用户名,率是人类基线倍。通用前提为0.17,社区对齐前提相对弱一些,其账号堆集了跨越10000的评论karma。正在专家用户里排到了前2%!
咨询邮箱:
咨询热线:
