喜马拉雅 PC端文章详情页顶部23-26

历时两年的微博与脉脉数据之争落幕,互联网公司请看好你家的爬虫!

对于数据的获取和使用,不再是一个技术问题、商业问题、道德问题,而是一个法律问题,所以,请看好你家的爬虫。

历时两年的微博与脉脉之争终于有了结果:法院认定脉脉非法抓取、使用微博用户信息行为构成不正当竞争,一审判决脉脉停止不正当竞争行为,并赔偿原告经济损失等220余万元。两年前我有关注到微博与脉脉的数据之争,这在口水战每天都发生的互联网圈本来不算什么大事。但这次法院判决结果,还是挺出人意料的。毫不夸张地说,这一事件给互联网公司敲响了关于用户数据保护的警钟。

一个常规的数据抓取纠纷

先简单说一下微博和脉脉之争的来龙去脉。

2014年8月公开闹掰:微博宣布停止脉脉使用的微博开放平台所有接口,理由是“脉脉通过恶意抓取行为获得并使用了未经微博用户授权的档案数据,违反微博开放平台的开发者协议”。与此同时,脉脉宣布终止支持微博登录,并通过一些邮件截图曝光微博此举,是因其投资脉脉不成,索要脉脉用户关系数据受阻后的报复。就像所有口水战一样,双方各执一词、真相扑朔迷离。

2015年3月对簿公堂:微博主体公司于2015年3月将脉脉主体公司告上法庭,微博脉脉之争升级。

微博起诉理由主要有脉脉非法获取和使用微博信息,商业诋毁等。

在用户微博登录脉脉并上传个人通讯录之后,大量非脉脉用户的微博头条、昵称、职业、教育等信息出现在脉脉上,这些信息并不在微博OPEN API之中,并且在微博停止脉脉所有接口权限之后,脉脉依然进行了相关数据抓取,微博认为脉脉通过非法手段获取信息。除此之外,微博认为在双方“闹掰”之后脉脉发表的公开言论对微博商誉构成了诋毁,脉脉采取了类似于微博加V认证的机制和界面设计,构成不正当竞争。

法院认定,脉脉绕过OPEN API抓取数据的行为,危害到微博用户信息安全,损害了微博合法竞争利益,对其构成不正当竞争,商业诋毁成立,判决脉脉停止不正当竞争行为,并赔偿原告经济损失等220余万元。

类似诉讼在互联网行业屡见不鲜。

2013年,百度因奇虎360违背Robots协议抓取复制百科等内容构成不正当竞争,起诉后者并索赔1亿元。

2016年2月,因认为百度视频通过抓取播放窗口的方式,嵌套乐视网视频资源到百度视频客户端,屏蔽了乐视网网页、网址、广告,造成公众混淆,构成不正当竞争,乐视起诉百度并索赔100万元。

2016年4月,大众点评诉百度旗下的百度地图及百度知道大量复制其用户点评等信息,构成不正当竞争,提出9000万元索赔要求。

这些案例均是某平台因内容被抓取起诉抓取方,在数据为核心资产之一的互联网产业,“数据纠纷”只会越来越多。

平台用户数据受法律保护

从法院一审的判决逻辑来看,是否保护用户信息已成数据纠纷中的法律准绳。

海淀法院在“世界知识产权日”公开宣判这一案件,或许不是巧合。其明确表示,“大数据时代,保护用户信息是衡量经营者行为正当性的重要依据,也是反不正当竞争法意义上尊重消费者权益的重要内容。”这表明,用户权益被摆在最优先位置。

在“人肉”这类网络暴力频发、用户资料屡屡泄露的大环境下,这一判决具有示范意义。平台在业务设计上必须充分考虑用户信息保护,确保用户信息不被滥用,隐私数据不遭泄露,同时确保用户对个人信息的使用有知情权。

在保护用户利益之后,才是平台利益。

值得注意的是,用户信息与用户数据并不是一回事,比如你在微信公众账号发的文章,算是用户数据,但你个人微信昵称、头像这些资料,才算是用户信息。但究竟哪些属于用户隐私则很难说,你上传到平台的照片肯定是隐私数据,但你发的公开微博就不一定了。那么,不具备“个人隐私”属性的数据是否受法律保护呢?如果有人绕过接口,抓取用户发的微博而不是个人信息,会有不同的结果吗?

这里有一个案例:百度起诉360违反Robots协议抓取知道、百科等数据的纠纷就是这样的情况,法院尊重Robots协议和平台对UGC数据的权益,360被判赔偿百度70万元。就是说,UGC内容的创建者是谁并不重要,搭建平台网站投入运营、技术和人力成本,拥有对数据的使用权和分发权。如果第三方网站违背意愿进行抓取,就可能被判为不正当竞争。

数据是互联网公司的核心资产,不论是个人信息还是UGC数据(微博、文章、点评等),所有这些平台数据都将受到法律保护,平台对这些数据拥有所有权、使用权和分发权。

互联网公司应提防数据纠纷

互联网公司想要利用别家平台的数据时,必须遵循对方的公共API协议,或Robots爬虫协议,抑或通过正式协议合作。数据受法律保护。互联网公司不能违背某平台意愿抓取其数据——在技术上或许并不难,可通过爬虫等手段绕过限制,实现数据抓取,但这样做很可能会吃官司,并且败诉几率相当高。

因为数据抓取纠纷而对簿公堂的案例还不算多,但数据抓取行为在互联网行业却很常见,比如许多平台都能看到豆瓣电影评分数据,再比如一些导购网站聚合了电商平台的评论,还有平台将微信公众账号所有文章都聚集起来…这些行为理论上来说都有数据纠纷的风险,如果你做得不够大平台一般也没这个精力理你,但万一你某天做到了呢?况且,很多大公司也这样干。

对于数据的获取和使用,不再是一个技术问题、商业问题、道德问题,而是一个法律问题,所以,请看好你家的爬虫。

本文系作者 罗超Pro 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持

喜马拉雅文章页评论上方

发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 分享一个免费好用的云端爬虫开发平台: 神箭手云爬虫开发框架 不需要安装环境,云上运行爬虫

    回复 2016.06.29 · via pc
  • 对此,我只能沉默以对。

    回复 2016.05.04 · via android

快报

更多

2024-04-25 23:02

大商所、郑商所夜盘收盘,棉纱跌超1%

2024-04-25 22:58

市场消息:马斯克将于下周一接受传讯,参与推特此前的裁员和解谈判一案

2024-04-25 22:55

transcosmos集团基于AIGC大模型构建全网舆情监控体系

2024-04-25 22:54

宋城演艺:一季度净利润2.52亿元,同比增长317.33%

2024-04-25 22:51

“美国头号房企”铁狮门正式进军上海高端长租公寓市场

2024-04-25 22:46

《上古世纪:战争》即将进军全球游戏市场

2024-04-25 22:44

本田汽车将在加拿大修建110亿美元规模的电动汽车中心

2024-04-25 22:37

字节跳动:没有任何出售TikTok的计划

2024-04-25 22:37

韩国SK Networks设立人工智能实验室PhnyX Lab

2024-04-25 22:36

现货黄金短线走高8美元,现报2331.5美元/盎司

2024-04-25 22:35

中钢协姜维:当前钢企库存处于历史同期高位,尽快降库存是行业保效益的首要任务

2024-04-25 22:32

美国至4月19日当周EIA天然气库存增加920亿立方英尺

2024-04-25 22:30

三一集团参与新西兰普伦蒂湾的道路建设项目

2024-04-25 22:28

敷尔佳:一季度净利润1.52亿元,同比下降4.77%

2024-04-25 22:27

美股内地教育概念股普涨,新东方、好未来涨超4%

2024-04-25 22:20

美国3月成屋签约销售指数环比增长3.4%,预期0.8%

2024-04-25 22:19

惠而浦跌9%,第一季度净销售额、经调整每股盈利均下滑

2024-04-25 22:18

传祺华为合作官宣落地,2025发布全新车型

2024-04-25 22:13

深圳:大力培育发展新质生产力,强化科技创新和产业创新深度融合

2024-04-25 22:12

IBM一度跌近10%,第一季度咨询业务表现疲软

2

扫描下载App