工作内容:我们的数据采集工程师将负责从各种数据源中提取数据,并将其整合到我们的系统中进行存储和分析。主要职责包括:- 数据采集:开发爬虫程序,从包括但不限于网站、API、日志文件等数据源中获取数据。- 数据处理:对获取到的数据进行清洗、去重、格式转换等处理,确保数据质量。- 数据存储:将处理好的数据存储到我们的系统中,支持多种数据库(如MySQL、Redis、Hadoop等)。- 数据分析:使用SQL或Python等语言对数据进行分析和查询,提取有用的信息。- 问题解决:遇到数据采集和分析过程中出现的问题,负责解决并跟踪问题的解决情况。职位要求:- 熟悉常用的数据采集工具和技术,如Python、Java、Selenium等。- 熟悉常用的数据库系统,如MySQL、Redis、Hadoop等。- 有爬虫开发经验,了解常用的爬虫框架,如Selenium+Python等。- 熟悉SQL语言,能够编写基本的SQL语句。- 有数据分析经验,熟悉常用的数据分析工具和技术,如Pandas、NumPy等。- 熟悉常用的开发框架和库,如Spring、Django、PyTorch等。- 不限工作经验,乐观积极,具备良好的沟通能力和团队协作精神。