爬虫架构师 25-50k·14薪
北京-海淀区 5-10年 本科
收藏
五险一金 餐费补贴
avator
矫女士 4小时前在线 已认证
招聘专员 · 海天瑞声
聊一聊
职位介绍
  • Python
岗位职责: 1. 设计并实现高效的大数据获取与处理系统,包括数据获取策略的制定、数据采集模块的开发以及数据存储和处理的优化。 2. 与业务团队紧密合作,分析和理解业务需求,根据业务需求提供定制化的数据获取服务。 任职要求: 1. 计算机相关专业本科及以上学历,3年以上爬虫开发工作经验,具有境内,境外大型网站爬取经验。 2. 熟练掌握Python等编程语言,具备良好的编程习惯和代码规范,具有多平台爬取经验(例web、Android、小程序等ios加分项)。 3. 熟悉常见的网络爬虫技术和工具,如Scrapy、BeautifulSoup等。 4. 熟悉网络协议、HTTP/HTTPS原理,了解TCP/IP、UDP等网络基础知识,能够处理各种网页格式和数据类型。 5. 具有良好的数据分析能力和问题解决能力,能够快速定位和解决爬取过程中的各种问题,掌握smail,熟悉常用的工具如jeb、jadx,熟悉静态分析、动态调试,代码跟踪以及应用frida,xposed等hook框架进行hook分析。 6. 具备较强的学习能力和团队合作精神,能够快速适应新技术和新业务。 7. 有分布式爬虫,熟悉分控策略对抗相关技术,了解设备指纹、账号资源,网络行为特征等对抗机制,能够对抗常见的人机识别或验证码、5s盾等大数据处理、机器学习等相关领域经验者优先。 加分项: 1. 有大型爬虫项目经验,能够独立完成从需求分析到数据获取和数据处理的全流程工作。 2. 对新技术和新业务充满热情,能够主动推动技术创新和业务升级。 3. 逆向、混淆、脱壳、反编译,风控
其他信息
行业要求:全部行业

公司简介

北京海天瑞声科技股份有限公司是国内 AI 训练数据专业提供商,自2005年成立以来,公司始终致力于为AI产业链上的各类机构提供AI算法模型开发训练所需的专业数据集。公司所提供的训练数据覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个AI核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。其中智能语音为公司的优势领域,服务/产品线已覆盖 150 余个主要语种及方言。
查看全部

职位透镜

您与该职位的匹配度: 登录查看
lens

猎聘温馨提示:

1. 如您发现平台内招聘方存在以下违规行为的,请立即举报
  • a. 扣押您的身份证件或者其他证件;
  • b. 要求您提供担保人、担保金或者以其他名义向您收取财物( 如培训费、体检费、资料费、置装费、押金等);
  • c. 强迫您入股或者向您集资;
  • d. 以招聘名义牟取不正当利益;
  • e. 发布虚假招聘广告信息;
  • f. 存在其他损害您的合法权益的行为。
2. 如您应聘的岗位属于涉外劳务合作/海外岗位的,请务必核实招聘方对外劳务合作资质取得情况,同时注意自身资金安全,防范招聘欺诈。
查看全部

猜你喜欢

1 2 3 4