25位模型开发者，联手反击李一舟 | 36氪专访

业界

TIME

2024-03-05 10:10

36氪

　　文｜周鑫雨

　　编辑｜苏建勋

　　一场针对“中国AI巨头”李一舟的声讨，正在轰轰烈烈地上演。

　　声讨者们，是图像模型开源社区LiblibAI上的模型创作者。2月21日，不少创作者发现，自己独家授权给LiblibAI的开源模型，未经允许被搬运到了名为“一舟智能”的网站上——据统计，至少有97个模型，遭到了搬运。

　　“一舟智能”的背后，则是彼时火遍全网的李一舟。当OpenAI的视频生成模型Sora再次引爆舆论，李一舟以“AI教父”的形象出现在大众面前，在直播间贩卖199元的“每个人的人工智能课”和“只剩最后一个名额”的焦虑——当然，效果也是惊人的，据飞瓜数据统计，价值199的人工智能课一年内卖出约25万套，销售额约5000万。

　　但技术热点造就的财富的B面，是李一舟经不起推敲的学霸人设，和对开源模型的涉嫌侵权。

　　成立于2023年5月，迄今已聚集了1万多名模型创作者的LiblibAI，已经是国内最大的AI绘画模型分享社区。社区中的模型，大多是爱好者们基于Stable Diffusion（以下简称“SD”）的微调模型，通过不同数据集的训练，模型能够创作出特定风格的图像，比如被李一舟搬运的LEOSAM，主打3D写实。

　　△LiblibAI社区中的模型。

　　上传模型的爱好者们，共同点是“用爱发电”。即便是基于SD的微调，这些模型前期依然要投入高昂的训练时间和成本。

　　LEOSAM的创作者“兔狲”曾公开自己训练模型付出的算力成本：在云计算平台Autodl上租赁算力花费了大约两万元，购买了英伟达4090和6000ada两块显卡花了大概8万元。

　　LiblibAI联合创始人张子捷告诉36氪，不同模型作者训练的方法不太相同，即便是最轻量化的微调模型LoRA，也要在训练过程中用数天的时间标注的几十至数百张图片，后期还要通过大量的XYZ plot测试（一种测试模型生图能力的方法），来检验训练成果，以此对模型进行调优。

　　“李一舟对模型的搬运让人不适的点在于，一是他没有得到作者本人的授权，二是他通过模型进行了谋利。大家投入很多金钱和精力做出的模型，被李一舟用来赚钱。”2月21日，LiblibAI联合创始人、运营负责人梅子收到了创作者给她私发的一舟智能网站截图，“令人费解的是，一舟智能专挑热门模型搬运，甚至没有标注原创作者信息。”

　　△被搬运到一舟智能网站上的模型。图源：B站UP主@朱尼酱等联合创作者

　　她发现，作者们授权（包括独家授权）给LiblibAI的多个模型，出现在了一舟智能的模型社区中，点击后就会跳转到会员的购买页面，每个月的订阅费在39元-399元不等——而这些模型，在LiblibAI上均为免费开源。

　　在创作者们多次联系一舟智能下架模型未果后，2月22日，LiblibAI代表作者发出声明：作为主张开源共享的社区，LiblibAI 允许用户直接使用模型、甚至下载模型，但未经创作者许可就搬运模型、甚至擅自用作商业化，则被平台视为“侵权”。

　　李一舟对开源模型的“偷袭”，也将一个问题抛到了行业面前：秉持着人人可用、技术共享理念的开源模型，使用的边界到底在哪里？

　　“开源，不代表无版权。”张子捷告诉36氪。他认为，站在模型创作者的角度，真正用于模型训练的，是经过标注的“数据对”，带有极强的主观性，微调模型可以被视作作者的二创。而站在平台监管的角度，LiblibAI作为社区，也需要保证开源模型被合规合法的使用，而不是随意搬运。

　　△LiblibAI上模型LEOSAM创作者“兔狲”关于使用权限的声明。图源：LiblibAI@LEOSAM是只兔狲

　　不过，证明开源模型具有著作权，依然困难重重。比如，如何对训练模型的数据进行溯源，如何认证标注后的训练数据没有对原数据作者构成侵权。

　　但开源模型社区的困境更在于：李一舟不是第一个，也绝不会是最后一个。

　　成立不到8个月，LiblibAI上的模型已经经历了不下十次大规模的被搬运。一些个人用户将模型下载后，又上传到其他的社区。

　　“李一舟甚至不是搬运最多的一次，但是影响最大的一次。”梅子表示。这几天，她与25名被搬运的模型作者并行取证。作为平台方，LiblibAI的两个主张为：第一，李一舟对模型作者构成著作权侵犯；第二，对LiblibAI构成不正当商业竞争。

　　平台和模型创作者们觉得，打赢这场战争，对构建更有秩序的开源生态至关重要。

用8万元和爱发电的模型，成了李一舟捞金的工具

　　36氪：大家是怎么发现模型被搬运到李一舟的网站上的？

　　梅子：我与模型作者有1V1建联。上周三（2月21日），我们的作者截了一张李一舟网站上的图，私发了我一份，也转到了我们的原创作者交流群里。

　　我们就觉得截图中的模型非常眼熟，发现这些模型都是熟悉的作者，甚至有的是LiblibAI独家的模型。作者们也很诧异，李一舟网站用的封面图和LiblibAI的也一模一样，都不带改的。

　　子捷：AI爱好圈的特色是彼此之间的交际非常紧密，大家有无数个小群。一旦有人收集整理被搬运的证据，这些截图和资料就会传播到各种群里，事情就开始持续发酵。

　　36氪：被搬运的模型一共多少个？

　　子捷：一共是97个。最早的时候被搬运的模型其实有100多个，个别模型作者和李一舟的工作人员私聊后，有一些模型就下架了。

　　随着越来越多的作者向我们反应，平台随即开始做侵权取证，比较各个群和渠道里面的截图，并且给法院认证的网页截屏做了“时间戳”，当时最终的计算结果是97个。

　　36氪：开源模型本身是可供各种用户下载使用的，那么李一舟的哪些行为让大家觉得自己的权益被侵犯了？

　　梅子：有人分析过李一舟网站的付费模式，一旦触发模型的生图功能，就会跳转到付费链接，价格也有不同的档位。相当于这些开源模型最终是为盈利目的搬运的。

　　子捷：被搬运的都是热门模型，基本上是LiblibAI首页推荐中的，其中不少模型还是独家授权给LiblibAI的，其他网站不得私自转载。开源模型的训练和微调，也需要作者付出很多的脑力劳动和资源，李一舟没有获得授权，就将模型作为牟利的手段，很不尊重创作者。

　　△一舟智能的收费模式。图源：B站UP主@朱尼酱等联合创作者

　　36氪：开源模型的微调需要投入多少资源？

　　子捷：具体的投入和模型的参数有关。一般而言，用一个非常小的微调模型LoRA，需要几十到几百张图片，训练会根据参数调整和内容需求的不同花费数个小时。但前期对图片进行采集标注，至少需要花三四天，训练完后还要对模型进行调优，做大量的XYZ plot测试（一种测试模型生图能力的方法），时间可能会无限长。

　　梅子：模型LEOSAM的作者“兔狲”提到过自己在云计算平台Autodl上租赁算力花费了大约两万元，购买了英伟达4090和6000ada两块显卡花了大概8万元。像他做Stable Diffusion XL的模型对算力的要求很高。

　　△“兔狲”关于模型微调过程的分享。图源：LiblibAI@LEOSAM是只兔狲

　　36氪：有联系上李一舟方面的人吗？

　　梅子：发现模型被搬运的当天，模型作者们尝试与一舟智能相关的工作人员沟通，但是未达成一致的协商解决方案。

　　和作者们确认细节后，我们是2月22日发的官方声明。在此之前已经有一些模型作者假装普通用户，问一舟智能的客服这些模型是否有授权，结果对方回答“有”。后来作者们亮出了真实身份，要求一舟智能立刻下架、道歉和赔偿，客服才匆忙改口。

　　但并不是所有的被侵权模型都立马下了架。不少作者发现几轮沟通后，自己的模型还是被挂在网站上，一舟智能也没有公开回应和道歉。所以我们就直接发了公开声明，给对方发了律师函。

　　36氪：大家的诉求是什么？

　　梅子：对于作者而言，李一舟应该下架所有侵权模型，赔偿通过侵权所得的不正当收入，并且公开道歉。对于LiblibAI而言，作者的诉求就是我们的诉求，平台获得了多少赔偿反而没那么重要。

开源，不代表无版权

　　36氪：发现模型被搬运后，大家采取了怎样的维权措施？

　　子捷：其实在最开始的时候，我们平台方比较谨慎和保守，和很多作者去了解情况。确认完后，我们再联系了律师进行咨询。

　　和律师沟通后，我们初步确定了维权的两个方向：第一，李一舟对模型作者构成著作权侵犯；第二，对LiblibAI构成不正当商业竞争。

　　梅子：发现当天，被搬运模型的作者就拉了一个有小20人的群。我在里面逐一和作者们沟通，明确他们没有把模型授权给李一舟使用。

　　模型作者是被侵犯著作权的直接主体，他们自己也在积极寻求法律途径应对。我们作为平台方，因为有得到模型的授权，所以我们认为有责任帮作者一起维权。但企业竞争和作者没有关系，所以由平台主动发起有关不正当竞争的维权比较合适。

　　36氪：开源社区是否就意味着上线的模型可以被使用？使用的边界是什么？

　　子捷：很多用户会把开源社区默认为无版权，上架模型可以随意转载使用。但并不是这样的。

　　从平台的角度出发，我们有责任对上线模型的使用进行监管和规范，比如我们要限制用户用开源模型去做生成违法的内容。任意转载将使平台的内容风险管控发生较大的隐患。

　　从模型作者的角度出发，作者会在社区明确规定模型的使用范围，很多模型明确要求不得用于商业用途，仅供学习交流使用。擅自的转载和商用，将使得作者创作研究模型的风险陡然增高。

　　36氪：在维权的过程中，有哪些难点？

　　子捷：目前AI模型版权的归属与侵权等问题尚无明确的判例给到一些支持，比如原创作者的模型受到哪些条例保护，是按照计算机程序保护还是作品著作权等，所以平台也要积极推动立法上对于AI模型知识产权的判定与保护。

　　36氪：律师对维权的态度怎样？胜算大吗？

　　梅子：我们咨询了好几个律师，他们的反馈都比较正向，给出的法律主张围绕侵犯模型作者著作权，以及对平台的不正当竞争。

　　同时，之前AI绘画侵权案是有判例的，当时案件结果明确表示AI绘画的著作权归原作者所有，未经授权搬运他人用AI生成的画作构成侵权。这个判例给了我们很大的信心。

　　△北京互联网法院针对人工智能生成图片（AI绘画图片）著作权侵权纠纷作出一审判决，认定AI绘画作者享有著作权。

我们期待生态的丰富，但前提是保护和尊重

　　36氪：这是LiblibAI上的模型第一次被侵权吗？

　　子捷：李一舟事件不是最大规模的一次搬运，却是影响力最大的。

　　其实从去年（2023年）5月平台上线开始，一直有不少AI爱好者把模型放在小社区上。

　　梅子：没有办法，我们很难去追查。个别作者和我们反馈过，在其他平台看到独家授权给LiblibAI的模型，大家一般会各自联系对方申诉，要求他们下架，但从来都没有像李一舟这一次一样形成规模效应。

　　36氪：但有时候，没有搬运，就没有影响力。

　　子捷：我们对于普及AI知识的行为是比较开放的，大家可以用我们的平台给公众授课。当然我们也欢迎他们和不同的作者联系，得到模型上线的授权。但前提是要保护或尊重，提前与作者及平台进行沟通，在不涉及不正当竞争的前提下去进行搬运。

　　36氪：作为开源社区，平台方有哪些措施可以减少侵权的发生？

　　梅子：我们会鼓励作者在模型声明里写明使用范围，比如“未经允许，不得商用”。同时，平台也会在模型详情页对作者的授权范围进行明确的展示。

　　我们最近也在和技术聊，短期内我们在试验能不能通过给模型加明暗水印的方式，来保护模型作者的权益。这个手段涉及技术方案的实现，也涉及模型作者的配合。但更长期，平台会投入更多精力关注并推动法律上AI版权保护的进一步明确。

开源社区，创作者是核心

　　36氪：LiblibAI的第一批创作者是怎么入驻的？

　　子捷：毫不夸张地说，是我们早期运营同学“肉搏”出来的，每个核心作者都得一个个定向邀请入驻。

　　梅子：因为当时国内是没有这样的图像模型分享社区，我们知道海外的AI社区Civitai上有很多中国作者苦于国内没有渠道，所以我们根据他们的公开联系方式，比如B站账号、QQ，只要能找到联系方式的，我们就1V1定向邀请，然后向他们介绍说，我们是国内第一家AI模型分享社区，非常希望他能入驻。

　　包括一些作者在北京或者上海，我们都会赶过去见面聊。比较欣慰的是大家热情挺高，基本上只要建联就能聊上，然后了解完我们想做什么之后，大家都会授权，再进来建立账号，把模型同步发到LiblibAI上。

　　36氪：第一批入驻了多少模型？

　　梅子：应该有几百个。有的作者手里有非常多模型，当时我们站刚刚成立，他们上传，我就觉得站子一下就满了。

　　36氪：目前LiblibAI的月活有多少？

　　梅子：月访问量是200多万。因为早期的作者已经在Civitai上有一些粉丝基础，加之一些KOL自发宣传国内有了新的模型站，当时带动了不少作者入驻。去年六七月的时候，我们就进入了非常高速增长的阶段。

　　36氪：LiblibAI应该是国内最早一家做作者激励计划的AI社区，当时是怎么考虑的？

　　梅子：因为我们和作者绑定得很紧密，大家都是用开源的精神去做模型，开放给大家用。我们的激励计划其实就是基于模型对平台的贡献，每个月给一些补贴和激励，可能不是特别多，只是对开源精神的一种感谢，同时也希望各位模型创作者相信可以与平台长期共同发展。

　　36氪：AI开源社区能够吸引作者的核心竞争力是什么？

　　梅子：我认为会分为不同的阶段，最早期的作者真的是和我们一起拓荒，更在意平台的理念与是否与他们契合，包括是否尊重原创作者及平台的运营规划；

　　而目前，平台的发展规模也十分重要，这些作者的模型值得被更多的用户看到、使用，双边关系的建立和效率尤为重要；同时，平台的生态定位也很重要，需要比较开放和多元。如果生态中只有一类模型，那只能吸引一类人。我们是垂类最丰富的模型社区，有摄影的、设计的模型，也有动漫的。不论偏好生产什么垂类的模型作者都可以在LiblibAI上找到归属感。

　　平台的生态定位也很重要，需要比较开放和多元。如果生态中只有一类模型，那只能吸引一类人。我们是垂类最丰富的模型社区，有摄影的、设计的模型，也有动漫的。

　　子捷：我们认为，AI首先是一个生产力工具，而不是娱乐工具。海外的一些AI社区把AI当做娱乐工具，根据用户的喜好想生成什么，就生成什么，导致社区的氛围很混乱。

　　所以我们在探索和扶持不同工业设计、建筑设计、室内设计等垂类赛道的模型，甚至愿意用真金白银去补贴。

　　36氪：开源社区如何商业化？

　　子捷：平台在最开始的时候并没有急着商业化变现，因为我们觉得大多时候快速商业化靠的是情绪化的消费，比如李一舟的AI课就很会贩卖焦虑。但这不是长远的。

　　我们从Day 1起就在探索AI的跨模态表达应该用怎样的方式解决，我们未来的产品和布局都是围绕回答这个问题去做的，当作为生产力工具的时机成熟了，在更多场景的应用真的行之有效了，我们相信商业化会是一个水到渠成的事情。

　　36氪：你们觉得商业化合适的节点是？

　　子捷：我们的商业化最终会围绕作者。从2023年12月开始我们进行了初步商业化的探索，一方面是为了弥补算力的消耗，另一方面也是为了更好的补贴作者，优质内容的增长需要有一个良性的回报机制。

　　AI技术还处在不断发展的阶段，我们认为当一项产品或服务有恒定或者真正的价值出现，而不是通过贩卖类似于“不学AI就会被淘汰”的焦虑带来的时候，正常的推进商业化才会给行业带来更新的动力。

　　我们觉得一个良性的商业化应该是长期的，要寻找供给和需求的平衡，而不是情绪化的。不然就会像李一舟那样，容易被反噬。

　　欢迎交流！

THE END

免责声明：本文系转载，版权归原作者所有；刊载之目的为传播更多信息，如内容不适请及时通知我们。

25位模型开发者，联手反击李一舟 | 36氪专访

相关热点

最新文章

相关推荐

东京奥运会中国第13金由游泳健将张雨霏斩获，一天斩获两枚金牌

两名航天员成功出舱航天员刘伯明成功开启天和核心舱节点舱出舱舱门

微信显示“正在输入”，其实不是在回复消息，背后原因挺“伤人”

关注我们

25位模型开发者，联手反击李一舟 | 36氪专访

相关热点

最新文章

相关推荐

东京奥运会中国第13金由游泳健将张雨霏斩获，一天斩获两枚金牌

两名航天员成功出舱 航天员刘伯明成功开启天和核心舱节点舱出舱舱门

微信显示“正在输入”，其实不是在回复消息，背后原因挺“伤人”

关注我们

两名航天员成功出舱航天员刘伯明成功开启天和核心舱节点舱出舱舱门