13910160652
010-52852558
| |EN
广西快三开奖结果跨度 > 互聯網 > 其他

广西快三开奖结果查询昨天:數據抓取的邊界在哪里?

——以公開的用戶生成內容為例

日期:2020-02-24 來源:中國知識產權報 作者:劉曉春 瀏覽量:
字號:

广西快三开奖结果跨度 www.evugqm.com.cn 中國社會科學院大學互聯網法治研究中心執行主任  劉曉春


利用爬蟲進行數據抓取,已經成為互聯網領域多個行業數據獲取和流通的主要方式,也被認為可能會發展成為未來企業獲取網絡上量級數據的基礎手段。但是,數據抓取同樣是數據權屬爭議的高發區,甚至如果被認定為“侵入”計算機系統,還可能觸犯刑律。數據抓取是數據獲取的一種重要通用方式,但目前,其法律責任的邊界并不清晰,有可能使行為后果產生高度不確定性,甚至產生過度威懾,從而阻礙數據流通和產業發展。在本文中,筆者以公開的用戶生成內容為例,來探討數據抓取的邊界。


現有司法實踐的特征


此前有關數據抓取引發權屬爭議的司法實踐,呈現以下特征:第一,無論涉及到抓取個人信息,如微博訴脈脈案,還是用戶生成內容,如大眾點評訴百度案,數據抓取被認定為不正當競爭行為者,典型的場景是沒有獲取用戶的授權,因此,法官不需要考慮支持甚至授權抓取行為的用戶意志在行為正當性評價中的角色。第二,法官在認定數據抓取構成不正當競爭行為時,都會著重考慮是否會對被抓取方構成不正當的競爭優勢的剝奪,在判決中,這樣的考慮通過不同的措辭表達出來,如“核心競爭優勢”“商業資源”“合法權益”,或“超出必要限度”“實質替代”“搭便車”“不勞而獲”。究其理論基礎,實際上都是擔心抓取行為導致的數據轉移,會導致被抓取方對于數據資產投入的激勵不足,因抓取方的“搭便車”行為而導致市場失靈。此外,法律實踐中對于針對公開和非公開數據的抓取行為還是存在不同的處理模式,對于非公開數據,如果需要破解技術措施,則行為構成不正當的可能性就會明顯增強。


無論具體情境有何不同,達成共識的一點是,對于數據的權益,尚不能構成法律上確定的“權利”,因而目前常見的做法是尋求反不正當競爭法下原則條款的?;?。這意味著,數據權益并不是事先設定,亦不具有確定構成要件和權利內容,而需要在具體案件中對于行為和情況進行事后考察,結合各種利益衡量的因素,由法官根據原則條款中的“商業道德”“公平誠信”等,來對行為的正當性作出判斷。本質上,反不正當競爭法的原則條款,提供的是行為正當性評價的依據,而非創設一般性權利的依據。盡管有些判決結果有可能在具體案件中確認了當事人的特定“合法權益”,但是,在規則運用過程中,理解反不正當競爭法原則條款的屬性和邊界,是十分有必要的。


法院在實踐中對這一點實際上理解得十分深入。在大眾點評訴百度的二審判決中,法官明確指出:“在自由、開放的市場經濟秩序中,經營資源和商業機會具有稀缺性,經營者的權益并非可以獲得像法定財產權那樣的?;で慷?,經營者必須將損害作為一種競爭結果予以適當的容忍。本案中,漢濤公司所主張的應受?;さ睦娌⒎薔勻ɡ?,其受到損害并不必然意味著應當得到法律救濟,只要他人的競爭行為本身是正當的,則該行為并不具有可責性?!?/p>


因此,在考慮個案的事實約束的前提下,對微博訴脈脈案判決提出的“三重授權原則”進行理解,是更加符合反不正當競爭法本意的做法。首先,該原則處理的是針對用戶信息通過OpenAPI模式進行數據交換的情形,其中同時涉及公開和非公開的數據,法院要求堅持“用戶授權”+“平臺授權”+“用戶授權”的三重授權原則,有其特定場景的事實約束,不見得能夠推廣到所有數據流動場景,特別是公開數據抓取場景。其次,該案中不正當行為認定的一個重要考慮因素,是被告未能獲得用戶授權,因此在認定過程中不需要考慮用戶意志的權重,不正當性的證成相對容易。最后,法院同樣也考慮到了此種行為對于原告利益的影響程度,認為非公開的用戶信息構成原告的“核心競爭優勢”,背后同樣是考慮了市場失靈和激勵原理,因此,結論同樣不應輕易擴展到不構成經營者核心競爭優勢的數據,尤其是對于數據使用的程度和規模不足以抑制投入激勵的情形。


抓取對象和方式的考察


在公開的用戶生成內容被抓取的場景下,對于抓取行為的法律邊界,要從抓取對象和方式兩個角度來考察,并進而從行為效果來綜合判斷其正當性。


在考察抓取對象的時候,需要對用戶生成內容所涉的權益歸屬進行場景化的分析。通常來說,典型的用戶生成內容,如消費評價、自媒體發布內容,主要涉及用戶和平臺兩方主體的權益關系。根據篇幅、傳遞信息類型和表達形式的不同,有些內容更容易符合獨創性的要求從而構成作品,納入著作權法?;さ姆凍?;而針對商品和服務的消費評價有可能更多比例是傳達相對客觀的信息,或者囿于篇幅過短無法構成作品。在存在著作權的情形下,作者擁有的是邊界相對清楚的法定權利,而即使無法構成作品,用戶作為內容的直接生產者,如果這些內容上產生法律需要認可的利益,用戶無疑也應當獲得相應的控制能力和話語權。


對于平臺來說,它們對于數據可以主張的權益,通常是基于其資本和經營投入,以及據此所產生的競爭優勢。與法定權利相比,“投入”和“競爭優勢”這些概念都是高度不確定的,是否受到法律的?;げ⒎僑縟ɡ謊竅榷ǖ?,而是要看其優勢被誰、出于何種原因、以何種方式被削弱。競爭者之間的正當競爭,恰恰是以相互削弱競爭優勢的結果體現出來,這也是反不正當競爭法想要努力?;さ哪勘?。


以用戶生成內容存在著作權的情形為例,假設用戶利益和平臺利益產生了沖突,用戶授權第三方對其已公開的作品數據進行抓取,平臺的權益是否可以阻止這種抓取行為?這就涉及到對于這些作品數據的法律屬性和權屬界分問題。從著作權法的體系看,作品在傳播過程中,有可能對作者的著作權形成控制的經營者權利,被法律固化為法定的鄰接權,典型的如音像制品制作者權利、廣播組織權,在法律賦權的前提下,這些傳播者可以基于其資本投入獲取激勵,從而對于作品的傳播產生對抗作者權利的控制能力。因此,類比來看,如果僅僅因為平臺有投入就給予平臺數據之上的排他權益,就相當于在著作權法所設鄰接權體系之外,創設了一種新型鄰接權,來對抗作者對于作品的控制,這顯然是不符合反不正當競爭法立法本意的。


從數據抓取的方式來看,也要避免路徑依賴,落入原有案例不同事實導致的分析思路。從法律上評價數據抓取行為,不應當僅限于技術上的比較,而應當將完成抓取的整體過程進行綜合考察。對于已經獲取用戶授權的數據抓取行為,盡管技術上有可能與此前案例類似,但是法律上的評價有可能迥然不同。在大眾點評訴百度和微博訴脈脈案件中,未經任何利益主體認可的數據抓取行為,一方面的確容易招致“不勞而獲”的指控,另一方面由于其沒有獲取授權的成本,因此更容易無限拓展從而更容易達成“實質替代”。但是,在獲取用戶授權之后的數據抓取,在法律上的屬性很可能是相反的。一方面,數據抓取是協助用戶實現對自己智力成果進行支配的一個輔助性技術過程,用戶的這一訴求本身合理合法;另一方面,正是由于獲取數據的前提,是需要依據用戶授權這一實質性投入,難言抓取者屬于“不勞而獲”的投機者。此外,需要獲得用戶授權的數據抓取行為也不具有任意擴張性,在效果上,實現“實質性替代”的可能性也大打折扣。


反思激勵不足的假定


從防止市場失靈的激勵理論出發,反觀數據抓取行為的效果,在復雜而多變的互聯網市場上,市場失靈和激勵都不是有和無的問題,而是強和弱的問題。很多時候法律規制數據抓取行為,也不見得是認為這些行為就會導致針對數據資產的投入急降為零,而是擔心會削弱市場資源對于數據資產的投入意愿。而且,數據資產之上的弱激勵并不一定總是對整體社會福利有害,如果弱的投入激勵能夠換取數據和信息的低成本傳播和利用,實際上有可能帶來更高的總體福利。在數據權益的激勵問題并未如同著作權法那樣被立法者確定下統一的判斷之前,法院就必須承擔起在具體個案中進行復雜衡量的責任,而不能遵循一個統一的前設假定,對特定行為模式作出劃一的規則嵌套。


同樣重要的是,市場上的激勵是多元而動態的,尤其是在復雜的商業模式當中,對于數據的投入并不總是需要法律上排他?;さ募だ?,也有可能商業模式和先發優勢的回報已經為企業的經營提供了足夠的激勵。因此,激勵不足常常是法官在特定場景下的一種推論。這種推論在相對簡單的行為關系結構中如果還能大致保持正確率的話,那么在加入了用戶意志、抓取行為成為數據傳播主流方式等動態因素的復雜場景下,很可能需要重新考慮其正當性和局限。在數據內容體現了更為復雜的利益沖突,而抓取行為本身具有更強合法外觀的情況下,如果還堅持對于數據抓取行為合法邊界的限縮,有可能導致的后果是,在“激勵不足”的假定之下,一方面,通過限制作者權利,從而削弱著作權法等特別立法已經明確確立的對于作者創作的激勵程度;另一方面,實質上?;ち松桃的J膠拖確⒂攀普廡┓床徽本赫ú⑽摶獗;さ木赫?。