Elon Musk发布Twitter推荐系统的源代码现在在GitHub上向所有人开放

615次阅读
没有评论

Elon Musk发布Twitter推荐系统的源代码现在在GitHub上向所有人开放

今天标志着Twitter进入了一个透明的新时代。🧵

我们将与世界分享我们平台的大部分源代码。请访问我们的博客,了解有关这一举措的更多信息:

Twitter 2.0中,作为互联网城市广场,我们相信我们有责任让我们的平台透明化。因此,今天我们迈出了迈向透明新时代的第一步,并向全球社区开放了我们的大部分源代码。

GitHub上,您会发现两个新存储库(main repoml repo),其中包含 Twitter 许多部分的源代码,包括我们的推荐算法,它控制您在 For You 时间轴上看到的推文。我们还在工程博客上的这篇文章中分享了有关推荐算法的更多信息。对于此版本,我们的目标是尽可能提高透明度,同时排除任何会危及用户安全和隐私或保护我们的平台免受不良行为者侵害的能力的代码,包括破坏我们打击儿童性剥削和性操纵的努力。今天的发布也不包括为我们的广告推荐提供支持的代码。

我们还采取了额外措施来确保用户安全和隐私得到保护,包括我们决定此时不发布与 Twitter 算法相关的训练数据或模型权重。

最终,这是我们以这种方式变得更加透明的第一步,我们计划继续共享更多不会对 Twitter 或我们平台上的人构成重大风险的代码。

我们邀请社区提交 GitHub 问题和请求,以获取有关改进推荐算法的建议。我们正在开发工具来管理这些建议并将更改同步到我们的内部存储库。任何安全问题或问题都应通过 HackerOne 提交给我们的官方漏洞赏金计划。我们希望受益于全球社区的集体智慧和专业知识,帮助我们发现问题并提出改进建议,最终打造更好的 Twitter。

作为互联网的城镇广场,我们最终这样做是为了提高透明度,并与我们的用户、客户和公众建立信任。随着我们在这一领域取得进展,我们将继续分享更新。

开源代码:https://github.com/twitter/

相关新闻

推特公开了部分源代码,包括推荐算法

来自:Kyle Wiggers

https://techcrunch.com/2023/03/31/twitter-reveals-some-of-its-source-code-including-its-recommendation-algorithm/

正如Twitter 首席执行官埃隆马斯克一再承诺的那样,Twitter 已经开放了部分源代码供公众检查,包括它用于在用户时间线中推荐推文的算法。

在 GitHub 上,Twitter 发布了两个 存储库,其中包含使社交网络运行的许多部分的代码,包括 Twitter 用来控制用户在 For You 时间轴上看到的推文的机制。在一篇博文中,Twitter 将此举描述为“[ing] 更加透明的第一步”,同时“[预防] 风险”给 Twitter 本身和平台上的人。

在今天的 Twitter Spaces 会议上,马斯克澄清道:

“我们最初发布所谓的算法会非常尴尬,人们会发现很多错误,但我们会很快修复它们,”马斯克说。“即使你不同意某事,至少你会知道它为什么在那里,并且你没有被秘密操纵……我们渴望的模拟是 Linux 作为一个很好的例子开源操作系统……理论上,人们可以发现 Linux 的许多漏洞。实际上,社区会识别并修复这些漏洞。”

关于防范风险的博客文章中的第二点,开源版本不包括为 Twitter 的广告推荐提供支持的代码或用于训练 Twitter 的推荐算法的数据。此外,它们几乎没有包含有关如何检查或实际使用代码的说明——强化了发布严格以开发人员为中心的想法。

“[我们排除]任何会损害用户安全和隐私或保护我们的平台免受不良行为者侵害的能力的代码,包括破坏我们打击损害儿童有关权益的努力,”推特写道。在Twitter 解雇了大部分符合道德规范的 AI 以及信任和安全员工后仅几周,就出现了一些混合信息,这些员工负责内容审核以及其他与用户安全相关的任务。但该公司仍然坚称,通过今天的代码发布,它“[采取] 了确保用户安全和隐私得到保护的措施”。

Elon Musk发布Twitter推荐系统的源代码现在在GitHub上向所有人开放

A diagram showing how Twitter’s recommendation pipeline works. Image Credits: Twitter

Twitter 表示,它正在开发工具来管理来自社区的代码建议,并将更改同步到其内部存储库。据推测,这些将在未来某个日期提供——目前没有任何迹象。

“我们将寻求建议,不仅是关于错误,还包括关于算法应该如何工作的建议,”马斯克在 Spaces 会议上说。“这将是一个不断发展的过程。我不认为这是一个不间断的上升趋势……但我们对改善用户体验的方式持开放态度。”

乍一看,该算法相当复杂——但从技术角度来看并不一定令人惊讶。它由多个模型组成,包括一个用于检测“工作不安全”或滥用内容的模型,确定一个 Twitter 用户与另一个用户互动的可能性,并计算一个 Twitter 用户的“声誉”。(目前还不清楚“声誉”到底指的是什么;高级文档对此并不清楚。)几个神经网络负责对推文进行排名并推荐要关注的帐户,而过滤组件会隐藏推文以 – 原谅行话——“支持法律合规,提高产品质量,增加用户信任,通过使用硬过滤、可见产品处理和粗粒度降级来保护收入。”

Elon Musk发布Twitter推荐系统的源代码现在在GitHub上向所有人开放

在一篇工程博客文章中,Twitter 揭示了更多关于推荐管道的信息,它声称每天运行大约 50 亿次:

“我们试图从数亿推文中提取最好的 1,500 条推文……今天,For You 时间轴平均包含 50% [来自你不关注的人的推文] 和 50% [来自你关注的人的推文],尽管这可能因用户而异,”推特写道。“排名 [tweets] 是通过一个约 4800 万参数的神经网络实现的,该神经网络不断接受推文交互训练以优化积极参与(例如喜欢,转推和回复)。”

当然,Twitter 用户看不到完整的 1,500 条推文。它们根据内容限制和模型考虑的其他标准和因素进行过滤,例如推文是否有“负面反馈”,以及它们是否主要来自同一 Twitter 用户,或者来自被屏蔽或静音的用户。

Gizmodo指出,一件似乎没有公开的事情是 Twitter 向用户推送的 VIP 名单。本周,Platformer报道称,Twitter 有一份值得关注的用户轮换名单,其中包括 YouTuber Mr. Beast 和 Daily Wire 创始人 Ben Shapiro,它通过看似随意地增加这些“高级用户”的可见性来监控推荐算法的变化.

有更多证据表明该算法可能会根据来源不同地对待推文。研究人员 Jane Manchun Wong 指出,Twitter 的算法专门标记了推文作者是否是 Elon Musk,还有其他标签表明作者是否是“高级用户”,以及他们是共和党人还是民主党人。

在今天下午的 Spaces 会议上,一位 Twitter 工程师表示,这些标签仅用于衡量指标。但是马斯克——他说他在今天之前不知道这些标签——说它们不应该在那里。

源代码的发布是在最近几个月涉及调整 Twitter 推荐算法的几起争议之后发布的。根据Platformer 的说法,2 月份,马斯克呼吁 Twitter 的工程师重新配置算法,以便他的推文得到更广泛的浏览。(Twitter 后来撤回了这一变化——至少在一定程度上。)11 月,Twitter 开始向用户展示更多他们不关注的人的推文——该平台在马斯克被收购之前曾尝试过这一举措,但后来因用户的强烈反对而撤销。

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy