《架构师》2023年1月
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

推荐文章|Article

亚编程神器Copilot被官司搞怕了?月收费19美元的商业版将提供辩护服务,最高索赔50万美元

作者 凌敏 核子可乐

Copilot的商业化“虽迟但到”。

GitHub推出商业版Copilot

据外媒theRegister报道,GitHub旗下的AI编程神器Copilot现已推出商业版本,每月收费19美元(约合133元人民币)。与普通版本的区别在于,商业版能够过滤掉公共源代码,并确保其底层机器学习模型不是从互联网上直接摘抄代码自动补全建议。

Copilot产品管理高级总监Shuyin Zhao在博文中解释道,“您可以轻松设置策略控制,代表组织对用户强制执行公共代码匹配设置。”

据GitHub介绍,大约1%的Copilot代码建议可能包含超过150个字符的代码片段,这与训练集中的代码完全一致,而这些代码就是根据各类软件许可,从公共在线源代码中挑选出来的。

为了避免滥用公共代码带来的风险,GitHub早在今年6月就推出了面向个人用户的正式版Copilot,定价为每月10美元(约合70元人民币)。开发人员可以在Visual Studio Code、JetBrains IDE、Neovim等集成开发环境中编程时使用,Copilot甚至可以建议复杂的算法以及样板代码并协助进行单元测试。

如今推出的商业版Copilot主要面向企业用户,虽然与面向个人用户的正式版Copilot在功能上存在交集,但定位并不一样。商业版Copilot面向的是拥有GitHub Enterprise Cloud许可证的客户,负责为客户提供集中的许可证管理,主要解决大型开发者团队的使用和付费管理需求。

商业版Copilot承诺,无论数据来自公共代码仓库、私有代码仓库、非GitHub代码仓库或者是本地文件,都“不会保留代码片段,也不会存储或共享客户的代码”。所以从理论上讲,企业客户可以完全放心,企业的机密商业算法绝不会被发送至GitHub并用于Copilot AI的产品改进。

但商业版Copilot仍然会传输“使用数据”,与编辑操作相关的事件(例如接受或取消补全),错误,以及延迟和功能使用情况等数据,其中包括假名标识符等潜在的个人数据。

经历过诉讼风波后,Copilot将为代码建议提供辩护和索赔

虽然商业版Copilot做出了不收集代码建议的承诺,但还不清楚是否会继续收集其他数据来改善后续代码补全效果。此外,客户也会对Copilot的代码合规性感到担忧——Copilot的代码建议很可能会将引发版权纠纷甚至是软件许可索赔。

毕竟这类事件已经发生过一次了。

今年6月,律师兼开发者Matthew Butterick写了一篇关于GitHub Copilot法律问题的文章,该文直指Copilot对开源许可证处理不当的问题。Butterick在一份新闻稿中指出,Copilot从一开始就明显存在法律问题。“作为拥有多年经验的开源程序员,我在第一次试用时就感受到了其中的问题。而且相信其他很多开发者也跟我一样,发现Copilot不对劲。结合自身法律背景,我觉得有必要拿起法律武器支持开源社区。”

11月,BUtterick宣布对Copilot提起诉讼,诉讼指出,被告方使用公共GitHub代码仓库进行Copilot训练,这侵犯了众多开发人员在各类开源软件许可上的合法权利。该诉讼已提交到美国加州北区地方法院,要求法院批准90亿美元的法定损害赔偿金。

GitHub显然也意识到了这种不确定性法律风险对企业客户信心的影响,因此对商业版Copilot产品特定条款中的Copilot输出约定做出调整,借此避免企业客户受到侵权索赔。

GitHub在企业客户协议中提到:“GitHub将为您辩护,以免无关第三方宣称您使用GitHub Copilot的行为涉嫌盗用商业机密,或直接侵犯了第三方的专利、版权、商标或其他知识产权,最高金额为50万美元、或您在索赔前12个月内支付的GitHub Copilot总使用费,以较高者为准。”

也就是说,如果企业客户因为采用了Copilot建议的代码而被起诉的话,GitHub将为其提供辩护,并提供一定金额的索赔。

不过,如果涉嫌侵权的代码与Copilot提供的代码建议不同,或是出现以下情况,GitHub将不会负责:未能遵循合理的软件开发审查实践;未能防止以可能侵犯第三方知识产权或其他权利的方式有意或无意地使用代码;并未启用GitHub的代码过滤功能。

一旦发生侵犯纠纷,Copilot个人用户和不在企业账户下的客户得自行面对法律诉讼。GitHub还明确提到,Copilot用户有责任审查所建议代码的安全性和合法性。