有人說智能推薦是一個偉大創造,是信息時代必不可少的工具。但與此同時,有人急切的想要拒絕智能推薦,認為這種追蹤是對個人隱私的侵犯,也有人認為智能推薦會使我們獲取的信息越來越狹窄、越來越片面從而走進信息繭房。
事實真的是他們所擔心的那樣嗎?答案是并非如此。那些帶來此類問題的推薦系統,是無法真正稱之為“智能”的。而成熟的智能推薦系統是可以成功避免這些弊端的。
那么智能推薦究竟是如何實現的?它的運算過程中是否涉及了我們的姓名、電話、身份信息等個人隱私呢?
我們首先從它背后所需的數據看起
一、智能推薦所需數據有哪些
(1)物料類數據:內容的文本類數據,如內容的標題、正文、作者、內容來源、標簽或關鍵詞、分類(如時政、健康、娛樂等)、發布時間等,在電商場景的話還可能會有價格、商品屬性、商品復購周期等。
(2)用戶類數據:地理位置數據:經緯度坐標;特定場景下的靜態身份數據:崗位、專業、技能等業務場景下才會需要到的身份數據。
(3)用戶行為數據:包含了用戶對內容發生的行為如點擊、分享、點贊、收藏、加入購物車、瀏覽時長、播放完畢等根據業務場景制定的能反映出用戶興趣的數據,也包含了用戶發生行為的時間即用戶點擊這條內容是在什么時間,用戶瀏覽10s是在什么時間。
二、智能推薦是如何采集數據的
物料類數據、用戶類數據通過數據庫到數據庫的方式便可完成上報,而用戶行為數據則需要進行行為的埋點才可以實現收集和挖掘。埋點就像公路上的攝像頭,可以采集到車輛的屬性信息,如顏色、車牌號、車型、人臉等。如果攝像頭分布處于理想狀態,那么通過疊加不同位置的攝像頭所采集的信息,基本可以還原出某一輛車的路徑、目的地甚至推測出司機是否是老司機,司機的駕駛習慣是怎樣等。
從智能推薦所需要的數據以及采集數據的過程,我們不難發現我們的個人隱私并不是它涉及到的部分,它所需要的更多的是我們的行為數據。
其次,一個成熟的推薦系統應當具備哪些條件呢,它會使我們進入信息繭房嗎?
信息繭房概念是由哈佛大學法學院教授、奧巴馬總統的法律顧問凱斯·桑斯坦在其2006年出版的著作《信息烏托邦——眾人如何生產知識》中提出的。通過對互聯網的考察,桑斯坦指出,在信息傳播中,因公眾自身的信息需求并非全方位的,公眾只注意自己選擇的東西和使自己愉悅的通訊領域,久而久之,會將自身桎梏于像蠶繭一般的“繭房”中。
如今的推薦系統早已能夠避免這個問題。它們擁有更加成熟的算法策略,更加全面的行為數據采集,以及為用戶提供的更多選擇。
內容分發,往往被看作是用戶對內容的被動接受,但其實平臺給了用戶很大的主動選擇權,這些選擇權就體現在用戶對內容的搜索、瀏覽、停留、關注、收藏、評論和轉發等行為上,機器通過這些行為讀懂了你的選擇,所以才產生了內容的個性化推薦。
智能推薦算法經過不斷發展,已從單一的興趣推薦發展到拓展用戶的興趣認知的層面上了,也就是說在縱向深化我們興趣點的同時,也在通過內容和用戶的交叉算法來橫向引導拓寬我們的興趣面。
編輯朋友們給我舉過一些例子,用戶在某平臺上看了幾篇“美國對中國加征關稅”的新聞,看完后發現信息流中推薦了大量的加征關稅的新聞,而用戶其實想看的是國內經濟發展的狀況。以此來說明,智能推薦會推薦大量重復的新聞,并且限制了用戶的視野。
推薦在資訊軟件里有不同的應用場景,比如信息流推薦、文章詳情相關推薦、搜索的個性化詞云等等,如果大量相似的文章被分發到相關推薦中,那肯定是沒問題的,但如果僅僅是依靠文本語義的相似在信息流的主路徑中被反復推薦,那么這套推薦機制我們并不認為它屬于“智能推薦”。成熟的智能推薦底層算法中,一定有針對于內容多樣性的考慮與設計。但重要的是,無論今天智能推薦的應用多么廣泛,獲取信息的主動權是從未離開過我們的手掌的。智能推薦的任務是使我們更加便捷的獲取有效信息,而并非主宰我們獲取的所有信息。
作者:艾克斯智能
鏈接:https://www.zhihu.com/question/392720139/answer/1211097139
來源:知乎
頂部
客服
微信掃碼聯系客服