一、職位描述:
1、負責設計和開發分布式的網絡爬蟲應用,包括調度、抓取、入庫等內容,進行互聯網相關信息的抓取和分析
2、負責實現大規模數據的抓取、抽取,去重、分類,垃圾過濾,質量識別、解析入庫等工作
3、負責對指定的多個網站進行網頁抓取、數據提取、破解反爬策略
4、承接開發任務,需求分析,確保按時按質按量完成任務
5、有良好的溝通和學習能力.有較強的團隊協作能力以及快速解決問題的能力。
二、崗位要求:
1、計算機或相關專業、具備3年以上項目開發經驗;
2、具有scrapy, scrapy-redis開發經驗;
3、具有web逆向經驗, 如滑塊驗證碼, 瑞數5代6代
4、熟悉多線程、網絡編程,精通網頁抓取原理及技術,精通正則表達式;?
5、熟悉并熟練應用各種常見加密算法;?
6、熟悉至少一種關系型數據庫(MySQL等); 熟悉NoSQL redis mongodb;至少熟悉一種mq, 有過數據庫調優和海量數據存儲經驗優先;
7、具有工商數據、金融數據、案件數據抓取經驗者優先;?
8、有移動平臺(iOS,安卓)開發經驗優先;
?