首页> 热点 >

曾索赔1元！“大模型数据被盗第一案”和解

2023-08-16 11:16:37 来源：商业新知网

导读

(资料图片)

笔神作文6月13日宣布起诉学而思，称其用爬虫盗取数据，这被称为国内大模型数据盗窃第一案。但其近日表示，双方已消除误会，不再对学而思数据调取事件发起诉讼。

来源| 数据观综合（转载请注明来源）

编辑| 蒲蒲

近日，世纪天鸿投资的AI辅助写作产品笔神作文发布声明称，已于8月4日决定不再对学而思，针对相关数据调取事件发起诉讼。

笔神作文表示，经与学而思深入调查并坦诚沟通后，对双方有争议条款已达成一致，双方已消除误会，并将继续深化合作，共同推进AI技术在教育领域的探索。

6年成果，被爬取200+万次，索赔1元

笔神作文将之称为“AI大模型数据被盗第一案”。此前6月13日下午，笔神作文通过自己的微信公众号、微博和第三方媒体发布消息称，遭到有多年合作关系的“学而思”背刺，指控学而思“盗取了我们的作文库存”，并称4月数据被窃取，学而思5月就公布进行数学大模型-MathGPT 的研发使用，“未免也太过于‘巧合’了”。

对此，学而思方面则发布声明回应称，该公司对笔神作文接口的调用，属于双方合同约定的正常合作范围，对笔神素材内容的使用均符合合同要求，并未用于合同以外的任何用途。

笔神作文在文章中表示，“我们的案件可能将会成为‘AI大模型数据被盗第一案’。”并表达了，要求公开致歉、删除非法获取的数据并中止应用、求偿1元的诉求。

对此，笔神作文解释道：“数据是有价值的，但我们心血更是无价，索赔 1 元是因为公平公正并不能用金钱衡量，我们希望通过诉讼告诉社会这种行为是错误的。人工智能行业的发展，靠的是共同创造，而非觊觎和剽窃他人的成果。”

公开资料显示，笔神作文是北京一笔两划科技有限公司开发的智能写作平台，拥有语文作文写前指导、作文批改评测等服务。

笔神作文在文章中称，“在过去笔神作文成立的6年时间里，我们每个月都会收到30万篇作文投稿和超过四十万的点赞。总共积累了超过500万篇作文素材，月批改量超3万篇。”但在4月一个周末，这些数据资源被爬虫爬取了超过两百万次。

文章中透露，笔神作文与学而思是合作关系，“虽然我们的产品已经设置了完备的数据安全机制，然而学而思却利用了我们的这份信任，利用了我们对合作伙伴的接口不设防。”

笔神作文表示，在数据窃取事件发生后，笔神作文找学而思进行求证时，对方直接承认，是他们的算法组在爬取数据并作为己用。

此前，好未来公司 (三体云联公司关联公司，前身学而思) 在5月5日的官方微信公众号发文表示: “学而思正在进行数学大模型-MathGPT 的研发使用，学而思学习机近期将上线一款‘AI助手’，涵盖作文助手......等相关功能。”

笔神作文方面直言，“4月我们的「作文库」数据被窃取，5月‘学而思’的「作文AI助手」新产品就即将上线了，这样‘巧合’未免也太过于‘巧合’了。”

笔神作文还称，团队多次向学而思发出律师函，但对方始终没有实质性答复。

不久后，针对笔神作文的这篇“征讨檄文”，学而思发布声明否认了笔神作文的说法，并称“对方在公开声明中提及学而思正在研发的数学大模型MathGPT以及学而思学习机‘作文AI助手’，并主观揣测我方使用其数据用于两款产品的训练和研发，这与事实严重不符”。

学而思从三个方面回应了笔神作文：

1、学而思和笔神作文于2020年12月开始合作，合作协议明确约定：笔神作文为学而思提供“笔神作文范文素材服务接口”，用于学而思相关服务中，每月保底费用包含的调用次数为百万次量级。合作至今，双方一直按照调用量进行正常结算。

2、我方对笔神作文接口的调用，属于双方合同约定的正常合作范围，对笔神素材内容的使用均符合合同要求，并未用于合同以外的任何用途。

3、对方在公开声明中提及学而思正在研发的数学大模型MathGPT以及学而思学习机“作文AI助手”，并主观揣测我方使用其数据用于两款产品的训练和研发，这与事实严重不符：首先，MathGPT是专注于数学领域的自研大模型，没有任何作文相关数据；其次，“作文AI助手”目前处于开发状态，尚未发布，该服务并未使用笔神作文的任何数据。

500万篇作文素材从何而来

作为AI核心要素之一的数据，据笔神作文和世纪天鸿披露，笔神作文积累的作文素材已超过500万篇。

世纪天鸿此前在互动平台中表示，笔神作文的大数据来源于自身累积，算法模型为公司自研训练。

此前5月8日，深交所对世纪天鸿下发关注函，其中要求说明公司是否向一笔两划提供训练“笔神作文”AI模型所需的数据；如是，需要结合公司有关数据的获取方式及来源等，按照《数据安全法》等相关规定，说明获取、处理及使用有关数据的合法性；有关数据资产产权的权属是否清晰、是否存在潜在纠纷，相关方是否存在其他协议及利益安排。

世纪天鸿回复关注函时表示，经核实，一笔两划训练“笔神作文”AI模型所需数据，均为一笔两划在自身经营过程中积累。截至目前，公司未使用“笔神作文”向客户提供服务，也未向一笔两划提供“笔神作文”AI模型训练所需数据。后续，如一笔两划就“笔神作文”AI 模型训练有数据采买需求，公司将严格按照《数据安全法》等相关规定，在确保有关数据获取、处理及使用合法、数据资产产权权属清晰，无潜在纠纷的前提下，协商确定具体业务合作方式。

笔神作文向《科创板日报》表示：“用户在笔神作文APP使用我们服务的过程中，根据协议，我们会积累大量用户的原始的作文素材，成为我们的资产。这也是学而思与我们合作的原因，学而思如果从头积累数据，时间成本很高，短期没有办法积累相同数量级的数据。”

据悉，根据笔神作文的用户服务协议，用户在笔神作文发表的内容，授予笔神作文免费且不可撤销的非独家使用许可。

平衡安全与发展成AI监管挑战

笔神作文与学而思的纠纷，牵引出大模型的一个“隐秘的角落”：用于训练AI大模型的数据，来源是否合法合规？事实上，关于大模型数据集的纷争已在海内外频频上演。

今年1月，海外图片供应商华盖创意（Getty Images）起诉AI绘画工具Stable Diffusion的开发者Stability AI，称其侵犯了版权。华盖创意称，Stability AI“非法”从网站上窃取了数百万张图片。

2月，《华尔街日报》的一名记者在网上公开表示，他向ChatGPT索取了一份用来训练它的新闻来源清单，收到的回复列出了20家媒体，但并不清楚OpenAI是否与所列出版商都达成了协议。

6月，美国一家律师事务所在加州一家联邦法院向OpenAI提起集体诉讼。根据诉状，OpenAI大规模盗取互联网用户与该公司产品的互动信息，及集成ChatGPT的应用中的隐私数据，并将这些信息用于该公司产品的模型训练。受害者据称可能多达数百万人，潜在损失高达30亿美元。

自去年底ChatGPT“一夜成名”，人工智能迎来“狂飙”时刻，AI生成内容（AIGC）领域快速发展。与此同时，数据泄漏、电信诈骗、个人隐私风险、著作权侵权、虚假信息等挑战层出不穷。

随着问题的凸显，各国也把对于AI的监管提上日程。斯坦福大学发布的《2023年人工智能指数报告》中提到，对127个国家的立法记录调研的结果显示，包含“人工智能”的法案被通过成为法律的数量，从2016年的仅1个增长到2022年的37个。报告对81个国家2016年以来的人工智能法律法规记录的分析也同样表明，全球立法程序中提及人工智能的次数增加了近6.5倍。

新一轮人工智能飞速发展，如何平衡发展与安全成为此次发展过程中的一道必答题。

关键词：

上一篇： 央媒发话：中国宽带费全球第二低，手机流量费远低于全球平均！
下一篇： 最后一页

精彩阅读

曾索赔1元！“大模型数据被盗第一案”和解
热点
笔神作文6月13日宣布起诉学而思，称其用爬虫盗取数据，这被称为国内大

央媒发话：中国宽带费全球第二低，手机流量费远低于全球平均！
热点
中国用户的通信费用负担进一步降低，固定宽带费用仅高于列支敦士登，位

滴普科技 x 国贸地产再牵手，数字化驱动地产行业破局增长
热点
近日，滴普科技再次牵手国贸地产，双方将共同建设国贸地产客户数据平台

张勇重塑阿里云，估值将达8000亿
热点
张勇亲自带队半年，阿里云终于重回增长，行业龙头的气魄也回来了。

电信改口不拆，联通则已获得批复要拆分上市......
热点
此次中国联通的分拆上市公告一出，算是给几年前画的“饼”一个实在的答

金智维快讯 | 金智维受邀出席第三届78CIO峰会，分享数字化转型最佳实践
热点
8月12日，金智维受邀出席由78CIO协会主办的第三届78CIO峰会·企业数字

【研判：人工智能在供应链管理中的应用及未来趋势】
热点
人工智能（AI）正在悄悄渗透许多行业，现在它正进军汽车供应链领域。

固定宽带费用全球第二低，宽带成“白菜价”了？
热点
国内用户的通信费用负担在全球排名第二，又上升一名。

羊驼进化成鲸鱼，Meta把对齐「自动化」，Humpback击败现有全部LLaMa模型
热点
有人认为LLM存在一些不可控的风险，给人类生存构成一些潜在威胁。

前哨丨特斯拉要新建“同类首个”数据中心
热点
8月14日，据美国汽车新闻网站Electrek报道，特斯拉开始涉足数据中心业务。

财富

1家只有1个人的公司，年赚1个亿！
资讯
1家只有1个人的公司，年赚1个亿！,“盖哥”和他的公司能给创业者哪些启

OpenAI向美国专利局提交“GPT-5”商标申请
资讯
OpenAI向美国专利局提交“GPT-5”商标申请,7月31日，美国商标律师JoshG

澳大利亚数据服务公司Vocus提出以42亿美元收购TPG资产
资讯
澳大利亚数据服务公司Vocus提出以42亿美元收购TPG资产,8月1日消息，澳

部分新款iPhone或推迟至10月以后发售
资讯
部分新款iPhone或推迟至10月以后发售,由于OLED屏的量产推迟，部分新机

恒大地产：所有存续公司债将继续停牌
资讯
恒大地产：所有存续公司债将继续停牌,恒大地产发布公告称，为保证公平

马斯克将领导X平台的产品及工程师团队
资讯
马斯克将领导X平台的产品及工程师团队,社交媒体平台X（前身为推特）表

多个AIGC应用在苹果应用商店下架
资讯
多个AIGC应用在苹果应用商店下架,包括讯飞星火在内的多个AIGC相关App，

上汽集团：7月份上汽销售新能源汽车9.1万辆
资讯
上汽集团：7月份上汽销售新能源汽车9 1万辆,据上汽集团官微，据初步统

京东回复收购永辉传闻：目前没有这个意向
资讯
京东回复收购永辉传闻：目前没有这个意向,针对“京东洽谈收购永辉”的

上半年A股37%新增上市企业为小巨人，江苏小巨人总量反超浙粤鲁，北京单个企业最高支持3000万丨专精特新资本市场半年报
资讯
上半年A股37%新增上市企业为小巨人，江苏小巨人总量反超浙粤鲁，北京单

MORE+ 资讯

1家只有1个人的公司，年赚1个亿！

OpenAI向美国专利局提交“GPT-5”商标申请

澳大利亚数据服务公司Vocus提出以42亿美元收购TPG资产

部分新款iPhone或推迟至10月以后发售

恒大地产：所有存续公司债将继续停牌

马斯克将领导X平台的产品及工程师团队

多个AIGC应用在苹果应用商店下架

上汽集团：7月份上汽销售新能源汽车9.1万辆

京东回复收购永辉传闻：目前没有这个意向

上半年A股37%新增上市企业为小巨人，江苏小巨人总量反超浙粤鲁，北京单个企业最高支持3000万丨专精特新资本市场半年报

MORE+ 热点

曾索赔1元！“大模型数据被盗第一案”和解

央媒发话：中国宽带费全球第二低，手机流量费远低于全球平均！

中国用户的通信费用负担进一步降低，固定宽带费用仅高于列支敦士登，位

滴普科技 x 国贸地产再牵手，数字化驱动地产行业破局增长

近日，滴普科技再次牵手国贸地产，双方将共同建设国贸地产客户数据平台

张勇重塑阿里云，估值将达8000亿

张勇亲自带队半年，阿里云终于重回增长，行业龙头的气魄也回来了。

电信改口不拆，联通则已获得批复要拆分上市......

此次中国联通的分拆上市公告一出，算是给几年前画的“饼”一个实在的答

金智维快讯 | 金智维受邀出席第三届78CIO峰会，分享数字化转型最佳实践

8月12日，金智维受邀出席由78CIO协会主办的第三届78CIO峰会·企业数字

MORE+ 焦点

让您大饱眼福这个巨大的Jabra Elite 10和Elite 8 Active泄漏

大多数我们最喜欢的Jabra无线耳机不太可能因其美观而赢得任何奖项，但

公安部交管局公布一批近期酒驾醉驾典型交通事故案例

法治日报讯记者董凡超近期，云南、西藏、广东、山西等地接连发生醉驾导

男子地铁扫码乞讨被乘客锁喉制服地铁禁止乞讨网友纷纷拍手叫好具体是啥状况呢

今天“【男子地铁扫码乞讨被乘客锁喉制服，地铁禁止乞讨网友纷纷拍手叫

郑煤机：融资净买入453.13万元，融资余额2.93亿元（08-15）

郑煤机融资融券信息显示，2023年8月15日融资净买入万元；融资余额亿元

微信公众号可以修改图片了！最多支持替换或删除 3 张

【CNMO新闻】微信公众号修改图片绝对是微信用户最想要的功能之一，但这

美军正在演练“同时打赢两个超级大国”

美军正在演练“同时打赢两个超级大国”,美军,演习,舰艇,军演,超级大国,

MORE+ 智能

微信公众号新增图片修改功能：最多三张

神奇之旅歌词（qq宠物神奇之旅时间）

引金融“活水” 助推水利民生--浦发银行郑州分行主承销5亿元中期票成功发行

融入园林要素建好口袋公园

金杯电工(002533.SZ)：公司订单充足，同比往期有一定增长

2800平方米，北京大兴跑出拆违“加速度”

切尔西第7签！凯塞多签8年，转会费1.15亿镑，英超历史标王

全国生态日 | 抓获9300余人山东公安严打各类污染环境和破坏自然资源突出违法犯罪

弘阳地产：上半年业绩预警

以“迅”应“汛”！北控水务全力以赴战洪水、保安全

精彩推送

曾索赔1元！“大模型数据被盗第一案”和解

微信公众号新增图片修改功能：最多三张

让您大饱眼福这个巨大的Jabra Elite 10和Elite 8 Active泄漏

央媒发话：中国宽带费全球第二低，手机流量费远低于全球平均！

张勇重塑阿里云，估值将达8000亿

滴普科技 x 国贸地产再牵手，数字化驱动地产行业破局增长

电信改口不拆，联通则已获得批复要拆分上市......

九台农商银行科技赋能“支农支牧”

公安部交管局公布一批近期酒驾醉驾典型交通事故案例

神奇之旅歌词（qq宠物神奇之旅时间）

【研判：人工智能在供应链管理中的应用及未来趋势】

固定宽带费用全球第二低，宽带成“白菜价”了？

金智维快讯 | 金智维受邀出席第三届78CIO峰会，分享数字化转型最佳实践

前哨丨特斯拉要新建“同类首个”数据中心

羊驼进化成鲸鱼，Meta把对齐「自动化」，Humpback击败现有全部LLaMa模型

桐柏县开展河南首个花生“保险+期货”收入险试点

男子地铁扫码乞讨被乘客锁喉制服地铁禁止乞讨网友纷纷拍手叫好具体是啥状况呢

引金融“活水” 助推水利民生--浦发银行郑州分行主承销5亿元中期票成功发行

科大讯飞的“极差”中报与“体面”减持

涉案超1216万元房全忠被判十年十个月

融入园林要素建好口袋公园

郑煤机：融资净买入453.13万元，融资余额2.93亿元（08-15）

2020年深圳展会时间表 2020年深圳展会时间表

微信公众号可以修改图片了！最多支持替换或删除 3 张

金杯电工(002533.SZ)：公司订单充足，同比往期有一定增长

主营产品产销量增加双汇发展上半年营收净利双增长

美军正在演练“同时打赢两个超级大国”

创影史最高纪录!2023暑期档上半程票房达87.87亿

湖南新晃：开启“三绿创森”模式

2800平方米，北京大兴跑出拆违“加速度”

哈尔斯营收净利双降，品牌和代工业务难平衡 | 看财报

盗窃7000元取得谅解书怎么判

切尔西第7签！凯塞多签8年，转会费1.15亿镑，英超历史标王

德合集团(00368.HK)盈喜：预计上半年纯利不少于750万港元

东方证券：上半年归母净利润19.01亿元，同比增长193.72%

全国生态日 | 抓获9300余人山东公安严打各类污染环境和破坏自然资源突出违法犯罪

大模型之争，华为暂时领先苹果

热血传奇万宇在线论坛（热血传奇万宇）

妙鸭背后，AIGC的C端漂流丨祛魅AI

雷特科技大宗交易成交15.00万股成交额185.85万元

弘阳地产：上半年业绩预警

遭腾讯“清仓式”减持，掌趣科技能用AI重获资本青睐吗？

奔驰旅行车有哪几款（奔驰旅行车怎么样）

大卫席尔瓦（关于大卫席尔瓦的基本详情介绍）

以“迅”应“汛”！北控水务全力以赴战洪水、保安全

贵阳贵安软件和信息技术服务业（上海）招商推介会在上海举办

中国LoRa产业链企业已超3000家，我们对未来保持乐观｜专访Semtech

打造餐厨垃圾处理“银川模式”

3109亿元！华为公布上半年成绩

江西“最美辅导员”项化平：坚守学生工作一线争当筑梦人

雷军2023年度演讲：人因梦想而伟大，不断追寻梦想，并不断成长

国债期货全线收涨

安阳市委十二届五次全会在我市各区党员干部中引发热烈反响

分析发现：5G对运营商收入拉动越来越难，危！

欠薪！停薪！央国企也没那么安稳了

猛！拿下2万多单，近700亿

SaaS出海：黄粱易得，黄金难收

iPhone 15也不行！富士康母公司：今年苹果、安卓手机销量都下滑后者更难

cdda大灾变（大灾变外挂）

美女新难题：如何自证不是AI

“降息”引人民币巨震！离岸人民币兑美元一度跌破7.31，国债期货创新高

电商模特1元购，人图背景随便换！国产AI工具降本99%

科大讯飞：刘庆峰卖出公司1.73%股份用于偿还借款本金

山西4A景区引猴下山，数百二级保护动物侵扰村庄

精进电动董秘回复：公司严格根据企业会计准则，按合同约定履行技术合同中的义务，技术开发工作在交付客户

永洪：《2023信创产业白皮书》轻松掌握信创产业最新最佳实践！

剑灵好玩吗烧钱吗（剑灵好玩么）

快手在贵州成立科技公司杨远熙任执行董事

持续推进生态系统保护和修复

30天揽金5千万，AI数字人能成为普通人的「财富密码」？

浅谈国内SaaS企业的核心挑战

人类数据告急，微软OpenAI开始用AI喂AI，奥特曼放话：未来所有数据都将变成合成数据

安道麦选择ZStack Cube超融合一体机进行虚拟化纳管升级

#阿里在深圳成立文化科技公司# 含人工智能业务

历史性一刻！中国首次超过美国，成为iPhone出货量最大单一市场【附全球智能手机市场分析】

梁田自曝遭性骚扰地铁上被尾随一直用恶心的眼光偷看

泉庄镇文化站暑期小课堂受称赞

广东近3年环境资源案件呈逐年下降态势

重磅！2023科脉云帆OS平台发布会定档8月18日

郑州出台政策支持元宇宙产业发展

经纬张颖：AI的远与近

秋水仙碱痛风的你吃对了吗？

【甘快看】甘肃：深挖绿洲农业优势乳企“扬”长项拓市场

湖北省宜昌市兴山县突发山体岩石崩塌致7人死亡

ISC 2023：数字政务安全体系为数字政府建设注入新动能

奥纳纳：丝毫不担心自己那动作是点球，相信裁判的工作

“百模大战”愈演愈烈，属于阿里云的增量机会来了

Citywalk是消费降级吗

兰州市中考第二次网上征集志愿15日22时开始

因疫情信用卡逾期11万无力还款可以处理吗

36家上市券商分红近340亿有7家派现金额超20亿

长相思第一季大结局基本情况讲解

天津滨海高新区发放首笔数字人民币“科创积分贷”

中食民安(08283.HK)中期实现归母净利111.4万新加坡元

8月14日基金净值：鹏华酒A最新净值0.496，跌1.2%

跑酷运动下载（跑酷运动）

怎样用手机做兼职工作（如何用手机做兼职赚钱）

北京一新车停小区后视镜被人掰断！北京警方特别提醒——

南京大报恩寺遗址博物馆“上新” 60余件文物亮相

美国奥克兰流浪汉激增：盗窃、吸毒泛滥