25位模型开发者,联手反击李一舟 | 36氪专访

业界
TIME
2024-03-05 10:10
36氪
分享

  文|周鑫雨

  编辑|苏建勋

  一场针对“中国AI巨头”李一舟的声讨,正在轰轰烈烈地上演。

  声讨者们,是图像模型开源社区LiblibAI上的模型创作者。2月21日,不少创作者发现,自己独家授权给LiblibAI的开源模型,未经允许被搬运到了名为“一舟智能”的网站上——据统计,至少有97个模型,遭到了搬运。

  “一舟智能”的背后,则是彼时火遍全网的李一舟。当OpenAI的视频生成模型Sora再次引爆舆论,李一舟以“AI教父”的形象出现在大众面前,在直播间贩卖199元的“每个人的人工智能课”和“只剩最后一个名额”的焦虑——当然,效果也是惊人的,据飞瓜数据统计,价值199的人工智能课一年内卖出约25万套,销售额约5000万。

  但技术热点造就的财富的B面,是李一舟经不起推敲的学霸人设,和对开源模型的涉嫌侵权。

  成立于2023年5月,迄今已聚集了1万多名模型创作者的LiblibAI,已经是国内最大的AI绘画模型分享社区。社区中的模型,大多是爱好者们基于Stable Diffusion(以下简称“SD”)的微调模型,通过不同数据集的训练,模型能够创作出特定风格的图像,比如被李一舟搬运的LEOSAM,主打3D写实。

  △LiblibAI社区中的模型。

  上传模型的爱好者们,共同点是“用爱发电”。即便是基于SD的微调,这些模型前期依然要投入高昂的训练时间和成本。

  LEOSAM的创作者“兔狲”曾公开自己训练模型付出的算力成本:在云计算平台Autodl上租赁算力花费了大约两万元,购买了英伟达4090和6000ada两块显卡花了大概8万元。

  LiblibAI联合创始人张子捷告诉36氪,不同模型作者训练的方法不太相同,即便是最轻量化的微调模型LoRA,也要在训练过程中用数天的时间标注的几十至数百张图片,后期还要通过大量的XYZ plot测试(一种测试模型生图能力的方法),来检验训练成果,以此对模型进行调优。

  “李一舟对模型的搬运让人不适的点在于,一是他没有得到作者本人的授权,二是他通过模型进行了谋利。大家投入很多金钱和精力做出的模型,被李一舟用来赚钱。”2月21日,LiblibAI联合创始人、运营负责人梅子收到了创作者给她私发的一舟智能网站截图,“令人费解的是,一舟智能专挑热门模型搬运,甚至没有标注原创作者信息。”

  △被搬运到一舟智能网站上的模型。图源:B站UP主@朱尼酱等联合创作者

  她发现,作者们授权(包括独家授权)给LiblibAI的多个模型,出现在了一舟智能的模型社区中,点击后就会跳转到会员的购买页面,每个月的订阅费在39元-399元不等——而这些模型,在LiblibAI上均为免费开源。

  在创作者们多次联系一舟智能下架模型未果后,2月22日,LiblibAI代表作者发出声明:作为主张开源共享的社区,LiblibAI 允许用户直接使用模型、甚至下载模型,但未经创作者许可就搬运模型、甚至擅自用作商业化,则被平台视为“侵权”。

  李一舟对开源模型的“偷袭”,也将一个问题抛到了行业面前:秉持着人人可用、技术共享理念的开源模型,使用的边界到底在哪里?

  “开源,不代表无版权。”张子捷告诉36氪。他认为,站在模型创作者的角度,真正用于模型训练的,是经过标注的“数据对”,带有极强的主观性,微调模型可以被视作作者的二创。而站在平台监管的角度,LiblibAI作为社区,也需要保证开源模型被合规合法的使用,而不是随意搬运。

  △LiblibAI上模型LEOSAM创作者“兔狲”关于使用权限的声明。图源:LiblibAI@LEOSAM是只兔狲

  不过,证明开源模型具有著作权,依然困难重重。比如,如何对训练模型的数据进行溯源,如何认证标注后的训练数据没有对原数据作者构成侵权。

  但开源模型社区的困境更在于:李一舟不是第一个,也绝不会是最后一个。

  成立不到8个月,LiblibAI上的模型已经经历了不下十次大规模的被搬运。一些个人用户将模型下载后,又上传到其他的社区。

  “李一舟甚至不是搬运最多的一次,但是影响最大的一次。”梅子表示。这几天,她与25名被搬运的模型作者并行取证。作为平台方,LiblibAI的两个主张为:第一,李一舟对模型作者构成著作权侵犯;第二,对LiblibAI构成不正当商业竞争。

  平台和模型创作者们觉得,打赢这场战争,对构建更有秩序的开源生态至关重要。

用8万元和爱发电的模型,成了李一舟捞金的工具

  36氪:大家是怎么发现模型被搬运到李一舟的网站上的?

  梅子:我与模型作者有1V1建联。上周三(2月21日),我们的作者截了一张李一舟网站上的图,私发了我一份,也转到了我们的原创作者交流群里。

  我们就觉得截图中的模型非常眼熟,发现这些模型都是熟悉的作者,甚至有的是LiblibAI独家的模型。作者们也很诧异,李一舟网站用的封面图和LiblibAI的也一模一样,都不带改的。

  子捷:AI爱好圈的特色是彼此之间的交际非常紧密,大家有无数个小群。一旦有人收集整理被搬运的证据,这些截图和资料就会传播到各种群里,事情就开始持续发酵。

  36氪:被搬运的模型一共多少个?

  子捷:一共是97个。最早的时候被搬运的模型其实有100多个,个别模型作者和李一舟的工作人员私聊后,有一些模型就下架了。

  随着越来越多的作者向我们反应,平台随即开始做侵权取证,比较各个群和渠道里面的截图,并且给法院认证的网页截屏做了“时间戳”,当时最终的计算结果是97个。

  36氪:开源模型本身是可供各种用户下载使用的,那么李一舟的哪些行为让大家觉得自己的权益被侵犯了?

  梅子:有人分析过李一舟网站的付费模式,一旦触发模型的生图功能,就会跳转到付费链接,价格也有不同的档位。相当于这些开源模型最终是为盈利目的搬运的。

  子捷:被搬运的都是热门模型,基本上是LiblibAI首页推荐中的,其中不少模型还是独家授权给LiblibAI的,其他网站不得私自转载。开源模型的训练和微调,也需要作者付出很多的脑力劳动和资源,李一舟没有获得授权,就将模型作为牟利的手段,很不尊重创作者。

  △一舟智能的收费模式。图源:B站UP主@朱尼酱等联合创作者

  36氪:开源模型的微调需要投入多少资源?

  子捷:具体的投入和模型的参数有关。一般而言,用一个非常小的微调模型LoRA,需要几十到几百张图片,训练会根据参数调整和内容需求的不同花费数个小时。但前期对图片进行采集标注,至少需要花三四天,训练完后还要对模型进行调优,做大量的XYZ plot测试(一种测试模型生图能力的方法),时间可能会无限长。

  梅子:模型LEOSAM的作者“兔狲”提到过自己在云计算平台Autodl上租赁算力花费了大约两万元,购买了英伟达4090和6000ada两块显卡花了大概8万元。像他做Stable Diffusion XL的模型对算力的要求很高。

  △“兔狲”关于模型微调过程的分享。图源:LiblibAI@LEOSAM是只兔狲

  36氪:有联系上李一舟方面的人吗?

  梅子:发现模型被搬运的当天,模型作者们尝试与一舟智能相关的工作人员沟通,但是未达成一致的协商解决方案。

  和作者们确认细节后,我们是2月22日发的官方声明。在此之前已经有一些模型作者假装普通用户,问一舟智能的客服这些模型是否有授权,结果对方回答“有”。后来作者们亮出了真实身份,要求一舟智能立刻下架、道歉和赔偿,客服才匆忙改口。

  但并不是所有的被侵权模型都立马下了架。不少作者发现几轮沟通后,自己的模型还是被挂在网站上,一舟智能也没有公开回应和道歉。所以我们就直接发了公开声明,给对方发了律师函。

  36氪:大家的诉求是什么?

  梅子:对于作者而言,李一舟应该下架所有侵权模型,赔偿通过侵权所得的不正当收入,并且公开道歉。对于LiblibAI而言,作者的诉求就是我们的诉求,平台获得了多少赔偿反而没那么重要。

开源,不代表无版权

  36氪:发现模型被搬运后,大家采取了怎样的维权措施?

  子捷:其实在最开始的时候,我们平台方比较谨慎和保守,和很多作者去了解情况。确认完后,我们再联系了律师进行咨询。

  和律师沟通后,我们初步确定了维权的两个方向:第一,李一舟对模型作者构成著作权侵犯;第二,对LiblibAI构成不正当商业竞争。

  梅子:发现当天,被搬运模型的作者就拉了一个有小20人的群。我在里面逐一和作者们沟通,明确他们没有把模型授权给李一舟使用。

  模型作者是被侵犯著作权的直接主体,他们自己也在积极寻求法律途径应对。我们作为平台方,因为有得到模型的授权,所以我们认为有责任帮作者一起维权。但企业竞争和作者没有关系,所以由平台主动发起有关不正当竞争的维权比较合适。

  36氪:开源社区是否就意味着上线的模型可以被使用?使用的边界是什么?

  子捷:很多用户会把开源社区默认为无版权,上架模型可以随意转载使用。但并不是这样的。

  从平台的角度出发,我们有责任对上线模型的使用进行监管和规范,比如我们要限制用户用开源模型去做生成违法的内容。任意转载将使平台的内容风险管控发生较大的隐患。

  从模型作者的角度出发,作者会在社区明确规定模型的使用范围,很多模型明确要求不得用于商业用途,仅供学习交流使用。擅自的转载和商用,将使得作者创作研究模型的风险陡然增高。

  36氪:在维权的过程中,有哪些难点?

  子捷:目前AI模型版权的归属与侵权等问题尚无明确的判例给到一些支持,比如原创作者的模型受到哪些条例保护,是按照计算机程序保护还是作品著作权等,所以平台也要积极推动立法上对于AI模型知识产权的判定与保护。

  36氪:律师对维权的态度怎样?胜算大吗?

  梅子:我们咨询了好几个律师,他们的反馈都比较正向,给出的法律主张围绕侵犯模型作者著作权,以及对平台的不正当竞争。

  同时,之前AI绘画侵权案是有判例的,当时案件结果明确表示AI绘画的著作权归原作者所有,未经授权搬运他人用AI生成的画作构成侵权。这个判例给了我们很大的信心。

  △北京互联网法院针对人工智能生成图片(AI绘画图片)著作权侵权纠纷作出一审判决,认定AI绘画作者享有著作权。

我们期待生态的丰富,但前提是保护和尊重

  36氪:这是LiblibAI上的模型第一次被侵权吗?

  子捷:李一舟事件不是最大规模的一次搬运,却是影响力最大的。

  其实从去年(2023年)5月平台上线开始,一直有不少AI爱好者把模型放在小社区上。

  梅子:没有办法,我们很难去追查。个别作者和我们反馈过,在其他平台看到独家授权给LiblibAI的模型,大家一般会各自联系对方申诉,要求他们下架,但从来都没有像李一舟这一次一样形成规模效应。

  36氪:但有时候,没有搬运,就没有影响力。

  子捷:我们对于普及AI知识的行为是比较开放的,大家可以用我们的平台给公众授课。当然我们也欢迎他们和不同的作者联系,得到模型上线的授权。但前提是要保护或尊重,提前与作者及平台进行沟通,在不涉及不正当竞争的前提下去进行搬运。

  36氪:作为开源社区,平台方有哪些措施可以减少侵权的发生?

  梅子:我们会鼓励作者在模型声明里写明使用范围,比如“未经允许,不得商用”。同时,平台也会在模型详情页对作者的授权范围进行明确的展示。

  我们最近也在和技术聊,短期内我们在试验能不能通过给模型加明暗水印的方式,来保护模型作者的权益。这个手段涉及技术方案的实现,也涉及模型作者的配合。但更长期,平台会投入更多精力关注并推动法律上AI版权保护的进一步明确。

开源社区,创作者是核心

  36氪:LiblibAI的第一批创作者是怎么入驻的?

  子捷:毫不夸张地说,是我们早期运营同学“肉搏”出来的,每个核心作者都得一个个定向邀请入驻。

  梅子:因为当时国内是没有这样的图像模型分享社区,我们知道海外的AI社区Civitai上有很多中国作者苦于国内没有渠道,所以我们根据他们的公开联系方式,比如B站账号、QQ,只要能找到联系方式的,我们就1V1定向邀请,然后向他们介绍说,我们是国内第一家AI模型分享社区,非常希望他能入驻。

  包括一些作者在北京或者上海,我们都会赶过去见面聊。比较欣慰的是大家热情挺高,基本上只要建联就能聊上,然后了解完我们想做什么之后,大家都会授权,再进来建立账号,把模型同步发到LiblibAI上。

  36氪:第一批入驻了多少模型?

  梅子:应该有几百个。有的作者手里有非常多模型,当时我们站刚刚成立,他们上传,我就觉得站子一下就满了。

  36氪:目前LiblibAI的月活有多少?

  梅子:月访问量是200多万。因为早期的作者已经在Civitai上有一些粉丝基础,加之一些KOL自发宣传国内有了新的模型站,当时带动了不少作者入驻。去年六七月的时候,我们就进入了非常高速增长的阶段。

  36氪:LiblibAI应该是国内最早一家做作者激励计划的AI社区,当时是怎么考虑的?

  梅子:因为我们和作者绑定得很紧密,大家都是用开源的精神去做模型,开放给大家用。我们的激励计划其实就是基于模型对平台的贡献,每个月给一些补贴和激励,可能不是特别多,只是对开源精神的一种感谢,同时也希望各位模型创作者相信可以与平台长期共同发展。

  36氪:AI开源社区能够吸引作者的核心竞争力是什么?

  梅子:我认为会分为不同的阶段,最早期的作者真的是和我们一起拓荒,更在意平台的理念与是否与他们契合,包括是否尊重原创作者及平台的运营规划;

  而目前,平台的发展规模也十分重要,这些作者的模型值得被更多的用户看到、使用,双边关系的建立和效率尤为重要;同时,平台的生态定位也很重要,需要比较开放和多元。如果生态中只有一类模型,那只能吸引一类人。我们是垂类最丰富的模型社区,有摄影的、设计的模型,也有动漫的。不论偏好生产什么垂类的模型作者都可以在LiblibAI上找到归属感。

  平台的生态定位也很重要,需要比较开放和多元。如果生态中只有一类模型,那只能吸引一类人。我们是垂类最丰富的模型社区,有摄影的、设计的模型,也有动漫的。

  子捷:我们认为,AI首先是一个生产力工具,而不是娱乐工具。海外的一些AI社区把AI当做娱乐工具,根据用户的喜好想生成什么,就生成什么,导致社区的氛围很混乱。

  所以我们在探索和扶持不同工业设计、建筑设计、室内设计等垂类赛道的模型,甚至愿意用真金白银去补贴。

  36氪:开源社区如何商业化?

  子捷:平台在最开始的时候并没有急着商业化变现,因为我们觉得大多时候快速商业化靠的是情绪化的消费,比如李一舟的AI课就很会贩卖焦虑。但这不是长远的。

  我们从Day 1起就在探索AI的跨模态表达应该用怎样的方式解决,我们未来的产品和布局都是围绕回答这个问题去做的,当作为生产力工具的时机成熟了,在更多场景的应用真的行之有效了,我们相信商业化会是一个水到渠成的事情。

  36氪:你们觉得商业化合适的节点是?

  子捷:我们的商业化最终会围绕作者。从2023年12月开始我们进行了初步商业化的探索,一方面是为了弥补算力的消耗,另一方面也是为了更好的补贴作者,优质内容的增长需要有一个良性的回报机制。

  AI技术还处在不断发展的阶段,我们认为当一项产品或服务有恒定或者真正的价值出现,而不是通过贩卖类似于“不学AI就会被淘汰”的焦虑带来的时候,正常的推进商业化才会给行业带来更新的动力。

  我们觉得一个良性的商业化应该是长期的,要寻找供给和需求的平衡,而不是情绪化的。不然就会像李一舟那样,容易被反噬。

  欢迎交流!

THE END
免责声明:本文系转载,版权归原作者所有;刊载之目的为传播更多信息,如内容不适请及时通知我们。

相关热点

  据国家发展改革委网站,根据近期国际市场油价变化情况,按照现行成品油价格形成机制,自2024年3月4日24时起,国内汽、柴油价格(标准品,下同)每吨分别提高125元、120元。  ...
汽车
  近期,有关苹果即将发布iOS17.4系统的消息引发了广泛关注。据科技记者古尔曼透露,苹果公司计划于2024年3月底发布一款支持新款硬件的iOS17.4“特别版本”。这个版本之...
数码

相关推荐

1
3