有没有人牵头搞个针对 Copilot 的 Robots 协议?

如题。

image

(上图这位是 popon.el 和 corfu{-doc}-terminal.el 的作者)

除了离开 Github,用户有没有方法阻止 Copilot 拿自己的代码去训练,比如在项目中声明拒绝 Copilot 访问?当然,遵不遵守是另一回事了,但是如果这么做的人多了、有影响力的组织也参与进来,我相信微软和 Github 应该还是要脸的吧?

2 个赞

记得设置里面不是有个选择的嘛?

感谢。

没开启 Copilot,同时也包含了禁止 Copilot 访问仓库代码的意思?

还是在项目里明确声明比较好。否则有的人禁止有的人允许,一个项目被人 fork 了,到底遵循谁的设置?

默认是不开放吧?

在不违背自由软件精神的前提下禁止项目代码用来被 learning 应该是不可能的。

因为只能在软件代码被分发的情况才能作为侵权看待。事实是 copilot 已经在类似商业条件下没有带协议就分发代码了,但还没有人能收集到足够证据或者有意愿提出起诉。就算被发现了,也就是提交个DCMA后然后主动把代码删除就能免于处罚的事。

远不如直接抵制平台有效。因为使用这个平台就相当于接受平台的“霸王条款”了。

所以,这里面还有辩论的空间。如果白纸黑字声明禁止用来训练 Copilot,就没有模糊地带了。

想要有法律效力的话,就得在法律层面上定义什么是 copilot,得有“如果用来起诉的话”的可行性,请律师是必要的。

推行一个类似 robots.txt 的标准的话倒是没啥问题,但 robots txt 一般不具备法律上协议的作用。

比如用 wayback machine 来爬 robots 禁止的页面用来做证据不被认为违法。

而且违反自己服务器的 robots txt 的话可以封爬虫作为惩罚,在 GitHub 上的代码连服务器都是人家的。

远不如自己整个 git host 禁止 copilot 来爬还比较有可行性。但 copilot 并没有在爬外站,所以只要不用 GitHub 就已经没有必要另外整个协议了。

离开 Github 也不是办法啊。你可以禁止 Github 来爬你的网站,但是无法禁止别人 fork 你的代码再放到 Github。

不止 Copilot,也要防范以后别的公司推出的类似服务。

copilot直接用gpl协议的代码来训练但是却不开源到底有没有违反gpl协议?GNU不知道有没有出来做出过解释。

1 个赞
  1. MS 声称是代码合成,主观上不够成分发代码,不受 GPL 约束
  2. 就算发现了有 GPL 代码,只要在收到通知后一定时间內移除就不会形成起诉。

FSF 说了不算,一切都只能由当地法庭決定。

至于反对意见,一直都是有的。

1 个赞

就像邮件服务商主张合理使用用户邮件内容、用于改善服务品质一样,Github 也早就买埋下伏笔:https://docs.github.com/en/site-policy/github-terms/github-terms-of-service#4-license-grant-to-us

而且 Github 更进一步,直接分发基于用户资料训练得来的内容。

人们不信任邮件服务商,于是有了 gpg 加密邮件,难道开源代码也要 gpg 加密起来,然后挂个浏览器插件阅读?

2 个赞

今天看到的,转发一下

也许是时候考虑,利用gitlab,搭建自己的git server。

今天看到的一张图, 感觉画得挺好的

1 个赞

这段声明出自哪里?谷歌只找到 3 个项目,都是最近几天加的:

https://www.google.com/search?q="we're+using+github+under+protest"

我找到了这个

1 个赞

应该就是这个了,底下有个 snippet: https://sfconservancy.org/docs/SupportGiveUpGitHub-README-snippet.md

有位知乎用户的倡议: