爬取數據,存在哪些法律風險
【法治課】
作者:蘭國紅(北京知識產權法院法官)
(資料圖)
互聯網時代充斥著海量數據。這些數據看似不起眼,但在算法加持下,成為商家競相爭奪的資源。數據生產非一日之功,非一人之力。在數據的巨大市場價值驅動下,數據爬取行為成為不少商家獲取數據的首選。那么,數據可以爬取嗎?什么樣的爬取是不被允許的?我們從兩起關于數據爬取的案例中探個究竟。
在百度地圖爬取大眾點評網用戶評論案中,涉案的百度地圖不僅有導航定位功能,還為網絡用戶提供商戶信息查詢、團購等服務。為吸引更多用戶,百度地圖大量爬取大眾點評網上的用戶評論。法院認為,百度地圖大量使用大眾點評網的點評信息,替代了大眾點評網向網絡用戶提供信息,攫取了大眾點評網的流量和交易機會,導致大眾點評網的流量減少,給大眾點評網造成了損害,構成不正當競爭。
在“鷹擊”系統爬取微博數據案中,“鷹擊”系統不僅爬取了微博前臺的公開數據,還繞過防范設置爬取了微博后臺的非公開數據。“鷹擊”系統爬取數據后,還進一步展示和分析微博平臺的數據,最終形成數據分析報告提供給用戶。法院認為,“鷹擊”系統這一行為干擾了微博平臺的正常運行,給微博增加了運營成本,影響了微博經營者對外授權并獲得相關收益,構成不正當競爭。
從上述兩起案件可知,數據是可以爬取的,但是爬取行為并不都是正當行為。如果爬取的內容達到實質替代數據來源網站的程度,則是一種“搭便車”行為,會造成對同業競爭者的損害。此外,繞過被爬取對象設定的訪問權限或者破壞網站所設定的技術措施爬取非公開數據的行為,會干擾被爬取方的正常運行,給被爬取方造成損害,也屬于不正當競爭行為。
有觀點認為,技術具有中立性,如果能夠繞過技術屏障爬取數據,恰恰體現了技術的進步,不具有可責性。這一說法有待商榷。因為技術本身雖然不具有可責性,但研發和使用技術的人對于技術的功能和目的是清楚和明晰的,其將技術作為手段實施不當的行為,當然具有可責性。
還有觀點認為,數據來源于用戶,并不能視為某一商家的財產而由其所獨有,應當允許自由利用。這一觀點有其可取之處,但絕非不當爬取數據的正當理由。數據本質上是信息的集合,數據的來源是多元的,可能來源于用戶,也可能來源于客觀事實,比如天氣信息、地理信息。無論數據來源于哪里,數據持有者只要對數據生成進行了必要投入,就應當得到保護。
數據爬取行為是眾多數據利用和處理行為之一。司法實踐中,涉及數據的不當行為還包括未經許可不當使用他人數據產品;不當獲取數據后形成并提供自己的數據產品;污染數據的刷單刷量;破壞或干預數據生成;設置Robots協議限制特定主體抓取數據等。
對于這些涉數據的不當行為,法律提供的保護路徑也比較多,涵蓋了著作權法、反不正當競爭法及反壟斷法。比如,既可以將數據產品作為匯編作品或計算機軟件作品提起侵害著作權的訴訟,也可針對抓取非公開數據的行為提起侵害商業秘密訴訟、針對刷單刷量行為提起虛假宣傳訴訟,還可以針對不予開放數據接口行為提起的反壟斷訴訟等。但由于多數情況下數據不具有獨創性,也不具有創造性或秘密性,傳統的知識產權部門法在保護數據過程存在不適配之處。為此,有必要為數據賦權,以促進數據的交易、流通,同時保護數據鏈條上相關者利益。
數據的無形性、非消耗性,使得數據與知識產權的保護客體有著天然的親緣。筆者建議在為數據創設權利時,充分借鑒知識產權的權利設計模式。同時,由于數據所涉利益主體具有多元性和交叉性,既涉及數據收集、加工主體的利益,也涉及個人信息和公共利益。因此,為數據提供的保護應當為弱保護,僅賦予數據有限的排他權。在具體權項設計上,應著重針對數據的持有、公開、利用、破壞等典型的數據不當行為創設相應的權利類型,并輔以相應的權利限制制度。
《光明日報》( 2023年03月25日?05版)
標簽:
- 01 熱門:全球超800萬用戶信賴,兩廂首選還是飛度
- 02 動態:東風本田HONDA HR-V,自驅向上!都市爬山虎與年輕人互勉!
- 03 天天精選!日產Formula E車隊將出征FE電動方程式巴西圣保羅站比賽
- 04 天天熱門:解讀江鈴大道,搭載雙2.3T發動機,氮氣減震和三把鎖也安排上了
- 05 世界資訊:體驗魏牌藍山: 零百4.9秒+大6座空間,叫板理想L8有戲嗎
- 06 天天簡訊:工視頻丨綻放巾幗風采,“她們”被表彰!
- 07 想買車的有福了,這十款SUV公認“最省油”,捷達VS7排第一
- 08
- 09 微速訊:FE電動方程式開啟第六站,日產Formula E車隊將出征圣保羅
- 010 今日熱搜:豐田混動,用上了比亞迪電池?!