[实习] [北京] [字节跳动] 搜索算法、搜索架构、数据挖掘、数据抓取
字节跳动搜索部门介绍:
字节跳动搜索部门主要负责今日头条、抖音、火山等产品的搜索业务,支持网页搜索和垂搜。通过大规模机器学习、深度学习算法,给用户最好的搜索体验,服务于字节跳动的全球用户。借助于字节跳动的流量和资源优势,你将与业界搜索大牛组成的一流技术团队共同成长,始终追求极致不断改进,一同探索搜索行业新的最佳实践。
招聘方向:算法、工程
地点:北京市海淀区北三环西路 43 号中航广场 1 号楼(矮楼)
搜索算法实习生
学历要求:本科及以上
职位亮点:弹性工作,免费三餐,休闲下午茶,扁平管理,职业大牛,团队氛围好
工作城市:北京
工作年限:不限
职位描述:
1、参与 ByteDance 搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验;
2、参与头条 /抖音 /TikTok 等核心产品的搜索研发工作,服务数亿全球用户;
3、参与搜索核心算法改进,可能的方向包括:
( 1 ) NLP:将业界最先进的 NLP 技术应用到搜索算法改进中,包括纠错、分词、改写、Term Weighting、意图识别;
( 2 ) Ranking:解决千亿级网页的排序问题,攻克基础检索、相关性、意图理解、权威性、时效性等世界难题;
( 3 )页面分析和摘要:从千亿网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验;
( 4 )链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等;
职位要求:
1、出色的分析问题、解决问题能力;扎实的代码能力,扎实的数据结构和基础算法功底;
2、有机器学习、NLP 和数据挖掘基础和开发经验者优先;
3、熟悉 linux 开发环境,熟练使用 C++和 python 语言;
4、如果你绝顶聪明,总是能 7 天深入一个全新的领域成为专家,则可以忽略以上所有要求;
5、2020 年及以后毕业,实习时间不少于 3 个月,每周不少于 4 天;我们希望能有充足的时间培养你,也希望你能充分参与业务做出卓越的贡献;
投递简历以“姓名+学校+获取信息渠道( XX 学校 BBS/脉脉 /boss 直聘)”命名发送邮件到
[email protected] ,邮件内容务必内包含实习天数+入职时间+实习长度(可以实习几个月)相关信息。
搜索架构研发实习生
学历要求:本科及以上
职位亮点:弹性工作,免费三餐,租房补贴,休闲下午茶,扁平管理,过亿用户,职业大牛,团队氛围好
工作城市:北京
工作年限:不限
职位描述:
1、参与 ByteDance 搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验;
2、参与头条 /抖音 /TikTok 等核心产品的搜索研发工作,服务数亿全球用户;
3、参与搜索核心架构改进,可能的方向包括:
( 1 )设计开发千亿级网页搜索的数据流、分布式建库、在线检索系统,设计业内领先的检索架构;
( 2 )设计开发万亿级 Spider 系统的实时计算、调度分发、压力控制、蜘蛛抓取等服务;
( 3 )设计开发高可用的搜索引擎稳定性解决方案、自动测试和运维平台;
4、在这里你可以毫无历史包袱地实现自己的架构梦想。
职位要求:
1、出色的分析问题、解决问题能力;
2、出色的代码能力,出色的数据结构和基础算法功底;
3、有分布式系统基础和开发经验者优先;
4、精通 linux 开发环境、C++语言、网络和多线程编程;
5、如果你绝顶聪明,总是能 7 天深入一个全新的领域成为专家,则可以忽略以上所有要求;
6、2020 年及以后毕业,实习时间不少于 4 个月,每周不少于 4 天;我们希望能有充足的时间培养你,也希望你能充分参与业务做出卓越的贡献。
投递简历以“姓名+学校+获取信息渠道( XX 学校 BBS/脉脉 /boss 直聘)”命名发送邮件到
[email protected] ,邮件内容务必内包含实习天数+入职时间+实习长度(可以实习几个月)相关信息。
数据挖掘实习生
学历要求:本科及以上
职位亮点:免费三餐,租房补贴,休闲下午茶,扁平管理
工作城市:北京
工作年限:不限
职位描述:
1、负责搜索 Spider 系统的基础数据挖掘和核心技术研发
2、负责互联网资源特征数据挖掘,包括页面特征、站点特征、页面价值度、热点变化趋势等
3、负责链接的反垃圾,识别无价值链接,控制链接规模
4、利用机器学习 /深度学习算法建立模型,预估链接质量
职位要求:
1、计算机或相关专业,本科及以上学历,2020 年及以后毕业
2、优秀的编码与代码控制能力, 有扎实的数据结构和算法功底
3、精通 C/C++语言编程,熟悉 linux 平台、shell 编程
4、每周实习至少 3 天,可以连续实习 3 个月以上
投递简历以“姓名+学校+获取信息渠道( XX 学校 BBS/脉脉 /boss 直聘)”命名发送邮件到
[email protected] ,邮件内容务必内包含实习天数+入职时间+实习长度(可以实习几个月)相关信息。
数据抓取实习生
学历要求:本科及以上
职位亮点:免费三餐,租房补贴,休闲下午茶,扁平管理
工作城市:北京
工作年限:不限
职位描述:
1、负责搜索 Spider 系统的架构设计和核心模块开发
2、负责搜索 Spider 分布式计算、调度、抓取、压力控制等模块的设计开发
3、负责蜘蛛程序的开发优化,基于 webkit 内核的 js 渲染引擎
4、负责网页特征抽取,利用模版或自动化抽取网页特征
5、负责搜索 Spider 数据可视化,日常数据分析和监控
职位要求:
1、计算机或相关专业,本科及以上学历
2、精通 C/C++语言编程,熟悉 linux 平台、shell 编程
3、对数据结构和算法设计有较为深刻的理解
4、有大数据工作经验,熟悉 hadoop/storm/spark 等经验者优先
5、有搜索引擎 /Spider 抓取等相关经验者优先
投递简历以“姓名+学校+获取信息渠道( XX 学校 BBS/脉脉 /boss 直聘)”命名发送邮件到
[email protected] ,邮件内容务必内包含实习天数+入职时间+实习长度(可以实习几个月)相关信息。