<mark id="bhm2s"><strong id="bhm2s"><samp id="bhm2s"></samp></strong></mark>
  • <rp id="bhm2s"></rp>
    <cite id="bhm2s"><b id="bhm2s"><tbody id="bhm2s"></tbody></b></cite>
  • <rp id="bhm2s"></rp>
        1. <dfn id="bhm2s"><video id="bhm2s"></video></dfn>

          1. <cite id="bhm2s"></cite>

              **Python軟件開發工程師 9-13K元/月

              立即開聊
              投遞簡歷
              • 1周前

                最近登錄

              • 1年

                會員等級

              • 單位性質: 民營企業
              • 注冊資金:
              • 員工人數:20-99
              • 營業執照:
              • 基本信息

              • 職位描述

                職位描述:
                1、負責網絡爬蟲系統平臺的架構設計與開發
                (如抓取調度,多樣化抓取,頁面解析和結構化抽取)、技術選型:
                2、研究爬蟲策略和防屏蔽規則,解決封賬號、封IP、驗證碼、混淆加密,算法還原,so層,頁面跳轉等難點攻克,提升網頁抓取的效率和質量:
                3、對抓取后的數據進行清洗、存儲等,并持續優化平臺,以便滿足各種爬取業務需求。
                崗位要求:
                1.精通Python語言或者Java語言,至少熟練掌握主流爬蟲框架中的一種:熟悉常用的庫requests/gevent等
                2.了解各種加密算法,在破解驗證碼方面有豐富經驗,能夠獨立解決is反爬和模擬登陸問題:
                3.熟練掌握正則表達式、XPath、CSS等網頁信息抽取技術:
                4.熟悉常見反爬機制,驗證碼識別,IP代理池
                應用lp池、headers認證和cookie等
                5.熟練掌握應用Selenium、PhantomJS
                Splash、Puppeteer實施動態抓取;
                6.熟悉熟練使用charles、fiddler等抓包工具者優先;
                7熟悉數據清洗,能夠用numpy、pandas
                iieba等工具對數據進行處理者優先:
                8.熟悉mvsgl、mongodb、redis.
                rabbitMQ、kafka、spark者優先
                聯系我時,請說是在吉安人事人才網上看到的,謝謝!
              • 競爭力分析
                你的競爭力超過了
                的求職者
                查看完整個人競爭力>>

              • 聯系方式

                溫馨提示:以任何形式向勞動者收取定金、保證金(物)的行為均違反《中華人民共和國勞動法》,請求職者提起注意并加以甄別。
              • 投遞簡歷
                立即開聊
              • 熱門搜索
              • 熱門職位
              • 熱門城市
              • 其他區域
              ×
              完善簡歷提醒
              你當前的在線簡歷填寫不完整,現在投遞求職成功率不高, 建議先完善后再投遞,不能浪費任何一個機會哦~
              去完善
              暫不投遞
              国产不卡的一区二区三区四区_亚洲重口无码av影院_有码无码人妻视频在线_亚洲日产av中文字幕
              <mark id="bhm2s"><strong id="bhm2s"><samp id="bhm2s"></samp></strong></mark>
            1. <rp id="bhm2s"></rp>
              <cite id="bhm2s"><b id="bhm2s"><tbody id="bhm2s"></tbody></b></cite>
            2. <rp id="bhm2s"></rp>
                  1. <dfn id="bhm2s"><video id="bhm2s"></video></dfn>

                    1. <cite id="bhm2s"></cite>