您当前的位置: 首页 > 职位列表 > 职位详情

python数据采集开发工程师

6000-7000元/月
投递简历
广东-广州-番禺区
3-5年
2025-12-22 14:13:17 更新 被浏览:57 次
广州加创商贸有限公司
最近在线时间:2025-12-22 14:13:17
电话:181********
地址:广州市番禺区市桥街道光明南路199号20号楼409室
职位描述

一、岗位职责
爬虫架构设计与优化:主导公司现有爬虫系统的技术升级,重构数据采集架构,增强系统的稳定性、可扩展性及执行效率,攻克高并发采集场景中的关键技术难题。
数据采集策略规划:根据业务目标(如采购分析、市场趋势研判),制定可持续的数据抓取计划,确保所获数据具备高价值与强时效,有效支撑核心决策流程。
反爬机制突破与应对:深入研究目标站点的反爬技术(如IP限制、验证码防护、前端动态渲染),提出切实可行的应对策略,涵盖代理池构建、验证码识别集成、动态内容解析等手段。
数据质量全流程管控:建立覆盖完整性、准确性、一致性的数据校验机制,提供清洗逻辑、存储结构及索引调优建议,提升数据资产的整体可用水平。
分布式爬取性能优化:设计并实施分布式采集架构,优化任务分发与调度机制,减少资源占用,显著提升海量任务的并发处理速度。
技术迭代与经验分享:密切关注爬虫领域新技术发展(如AI辅助识别、高性能解析工具),结合实际场景推动技术落地;定期组织内部分享,带动团队技术能力持续提升。
合规与安全保障:掌握数据采集相关法律法规(如数据安全法、个人信息保护法),确保采集行为合法合规,主动识别潜在法律风险,并提供可行性合规建议。

二、任职要求
技术基础扎实:拥有丰富的爬虫开发实践,精通Python语言,熟练使用Scrapy、Selenium、BeautifulSoup、Playwright等主流爬虫框架与工具链。
反爬攻防能力突出:深刻理解多种反爬机制(包括IP封锁、UA伪装、JavaScript异步加载、滑块验证等),具备成功突破复杂防护的实际项目经验。
数据处理与存储经验:具备处理大规模数据的能力,熟悉MySQL、MongoDB、Elasticsearch、Redis等数据库的配置与性能调优,能针对性设计高效的数据存取方案。
分布式技术能力:掌握Celery、Kafka、RabbitMQ等分布式任务管理工具,有在高并发环境下进行性能调优的成功案例。
团队协作与沟通:具备良好的跨团队沟通能力与协作精神,能够清晰传达技术思路,指导开发人员完成任务落地,助力团队整体技术水平提升。
行业经验优先:具有电子元器件等行业数据获取经验者优先,能基于行业特点定制化设计采集策略。
合规意识强烈:熟悉爬虫法律边界,有依法依规开展数据采集的实践经验,能主动规避合规风险。

三、优先考虑条件
具备大型数据平台或市场情报系统的架构设计或核心开发背景;
拥有机器学习或数据挖掘基础,可从原始数据中提炼高价值信息(如用户行为模式、市场需求预测);
有海外电商、跨境贸易类数据采集经历,了解国际网站的数据结构特征与信息获取方式。

四、投递须知
若您满足以上条件,且可接受在广州全职到岗工作,欢迎提交简历!我们期待与您共同建设稳定、高效、合规的数据采集体系,为业务发展提供坚实的技术保障~

求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
爬虫技术顾问工程师
4000-7000元/月
广东-广州
2025-12-27 14:42:22
投递简历
爬虫开发工程师
6000-8000元/月
广东-广州
2025-12-27 14:37:22
投递简历
数据采集顾问
1-1.1万元/月
广东-广州
2025-12-27 14:30:22
投递简历
python爬虫开发工程师
4000-5000元/月
广东-广州
2025-12-27 14:08:22
投递简历
爬虫技术顾问工程师
4000-7000元/月
广东-广州
2025-12-22 14:36:39
投递简历
爬虫工程师
6000-8000元/月
广东-广州
2025-12-22 14:31:39
投递简历
数据采集顾问
1-1.1万元/月
广东-广州
2025-12-22 14:12:53
投递简历
俄语实习岗位
120-150元/天
广东-广州
2025-12-11 07:36:21
投递简历
俄语实习岗位
120-150元/天
广东-广州
2025-11-19 16:16:14
投递简历
您可能感兴趣的职位 搜索更多相似职位 >
推荐企业 职位专题
广州加创商贸有限公司
公司主页 >
微信求职找工作
手机扫一扫
手机扫一扫
随时随地找工作

海量高薪岗位在线免费直招 招聘者/求职者电话直聊

微信小程序
手机也能找工作