第三方抓取X平台数据没有违法,但肯定是不道德的

看到一篇文章《马斯克败诉:法院认为第三方抓取X/Twitter平台数据并没有违法》,感觉挺遗憾的,我认为在X平台已经明确拒绝的情况下,第三方(Bright Data)仍然抓取X平台数据的做法是不道德的。

法院在审理过程中强调了一个关键问题:社交网络实际上是不拥有用户数据的,因为社交网络平台不能一方面享受避风港原则带来的好处,一方面又强调数据属于自己。

如果说平台本身不拥有数据,那么平台是否还有保密、保护等义务?例如你在A站创作的内容,被某人窃取发布者B站,那么A站有没有义务帮助你去B站维权?这就是著作权问题,特别是声明了“不得转发”的内容。 第三方(Bright Data)抓取数据时,极有可能也抓取了声明“不得转发”的内容。既然平台本身不拥有数据,那么去对抗平台级的抄袭者,只能靠身单力薄的作者个人了。

我国没有避风港原则,平台需要负责管控着用户的一言一行。所以我们有时莫名其妙的……啊不,依据有关部门的法律法规和公关部门的通知,被删帖、被限流、被禁言。我转发的一些微博,收藏的视频,不知道何时就被删了,我甚至不知道被删的是啥,更别说理由了!当然,理由也不需要告诉我,为啥被删心里还是有点儿数的……他们知道我知道,我知道他们知道我知道,一切尽在不言中。

在这起案例中,法院认为 X/Twitter 可能会造成影响公共利益的信息垄断,即该平台本身不拥有数据而是通过其他方式向用户提供公开的数据,因此 Bright Data 抓取这些公开数据自然不算是违法行为。

问题在于,这些数据是否属于公开数据?由于任何人都可以查看平台上的内容,因此客观事实上确实属于公开的。但对于平台上的一些用户而言,他们认为的公开可能仅限于此平台,仅限于这个“圈子”里,并不希望被其它平台的用户来打扰。你也不想被个别别有用心的人,将内容截图发布到其它平台上说“原来这个人在那里说这种嘴脸”。当然,由于客观上平台的公开,是否不被打扰也只能寄希望于他人的素质了,显然Bright Data不具备。

法院认为如果禁止抓这些公开数据会造成影响公共利益的信息垄断,那么该平台当前是否具有垄断地位?国际上与X类似的平台还有Facebook、Threads等,不像我国实际只剩新浪微博一家。另外,具有垄断地位的平台是否有义务为其它平台提供免费服务?“爬虫”软件对平台的资源消耗远大于真人用户,而且对被爬取的平台没有任何好处。

对于 X 认为 Bright Data 抓取数据、销售数据抓取工具是欺诈、违反使用条款、非法侵入和欺诈的说法,法院同样不认同,法院认定 X 试图对用户信息主张版权的行为不符合法律。

我觉得法院应当支持“违反使用条款”这个说法。多数平台是只允许真人访问;或者只允许非商业使用;或者允许“爬虫”软件抓取部分公开数据,而不是抓取所有数据。Bright Data肯定知道这些江湖规矩,但不遵守。类似的还有一些公司使用开源代码,却不遵守开源协议(GPL)的事。反正我在普通用户眼里是有头有脸的,这种下三滥的专业事他们也不懂。主打的就是你能把我怎么样,不信你瞧法院也支持我。

留下评论

您的电子邮箱地址不会被公开。 必填项已用 * 标注