ARK的女巴菲特在big idea中宣称大数据行业创造的财富价值将远超互联网,你是否为这样的新兴行业砰然心动?阿里腾讯华为动辄年薪百万的数据岗招聘频上热搜,你是否对这样的高薪职业心驰神往?
在各类求职网站上搜索数据科学相关岗位,你看到的招聘广告往往是这样的:招聘数据科学家要求:计算机,数据,统计或相关专业硕士及以上学历一至两年工作经验熟练使用python编程语言和大数据平台,如hadoop, spark熟悉统计分析,数据挖掘和机器学习相关知识有较好的团队沟通能力和书面表达能力看上去是不是很熟悉?是不是觉得自己都符合要求,但求职中却屡遭碰壁?确实,各类IT企业、电商平台、金融科技公司,虽然其业务领域大不相同,在招聘入门级别数据科学岗位的要求上并没有太大的区别。
这就对大家准备相关技能和工作选择带来了比较大的困扰。今天,我们就来全面剖析数据科学相关岗位,教你做好精准的技能准备,助你规划可行的职业方向。看完这篇文章,你离百万年薪的数据岗就差投简历了!
1数据岗位入门需知
从岗位设置上来说,数据岗位一般分为数据分析和数据建模两个大方向。
- 数据分析师
- 工作内容:
根据公司的业务需求,开展数据统计与分析,制作数据报表,验证数据质量,提供商业决策建议。
- 薪资:
- 校招起薪:2万+/月
- 1-3年经验:3-5万+/月
- 4-5年经验: 5-10万+/月
- 细分方向与发展路径
- Data Analytics :技术路线可发展为Big Data Scientist,管理路线可以做Data Analytics Lead。但目前市场上,纯技术团队Leader的坑位有限,更多需要业务方面的相关知识加持。
- Product Analytics:针对特定产品的分析,由于对技术分析和产品都需要有一定的了解,后续可往Data PM方向发展。
- Business Analytics :和商业场景结合更紧密,不光需要数据分析能力,也需要对商业领域的理解和嗅觉,例如最近很火的增长分析师和策略分析师,都是不错的发展方向。
- Risk/Quant:更侧重金融领域,一般对统计学/数学+经济学/金融两个方向都有比较高的要求,门槛相对较高,入场薪资也相对较高。
- 所需技能
- 熟练使用SQL查询语句
- 熟练使用图查询语言,如neo4j的cyper语言
- 制作excel报表
- 熟练使用数据可视化工具,如tableau, grafana, superset
- 数据科学家
- 工作内容:
除了数据分析工作外,更多承担数据模型的设计和研发。
- 薪资:
- 校招起薪:3万+/月(华为天才少年、阿里星等可达百万年薪)
- 1-3年经验: 4-6万+/月
- 4-5年经验: 6万+/月(上不封顶)
- 细分方向与发展路径
- 大数据算法:可应用于各种场景的数据建模,比如时间序列预测、大数据处理等。适合入门选手/DA转DS选手/知识和技能有相关性但并没有特定算法领域相关性的人。
- 特定场景/算法领域:一般会要求有相关领域经验,比如前两年高光的计算机视觉,再比如这两年高光的搜索推荐。此类数据科学家在本职领域会非常有竞争力,但其经验不易泛化到其他数据场景。
- 所需技能
- 熟练使用spark大数据平台
- 熟练使用pandas,sklearn,xgboost, tensorflow,pytorch等python包
- 深入了解机器学习的常用算法
- 熟练使用模型线上运维工具,如git, docker, jenkins,ELK
所以,敲重点!如果你有数据分析技能且具备商科背景,数据分析师是个不错的选择,你将有机会运用数据分析助力公司的商业决策。如果你有扎实的数学功底或对某一场景的算法有着深入理解,数据科学家则是你的不二选择。
2数据工作场景划分
不论是数据分析师还是数据科学家,其基本技能要求是非常类似的,包括数据查询,分析工具使用,和报表展示等。但具体到不同的业务场景下,由于相关的数据千差万别,其分析和建模方法也大不相同。我们根据业务场景,归纳了四种常见的数据类别及相应的分析/建模方法,方便你对号入座:
- 文本语音类数据
科技公司基本都会提供信息检索、客服对话的服务,因而产生大量的文本语音数据,而这些数据都会用来改善服务的速度和精度。这类文本语音数据需要把数据转换成可计算的形式,需要文本分词,POSTAG,Word2Vec这些NLP领域特有的数据处理手段。
- 图像视频类数据
一款好的产品介绍需要图片和短视频来呈现,以吸引更多的客户;注册金融类账户一定需要上传身份证图片,做人脸识别活体检测。这些活动都会产生很多的图片视频类数据。这类图像数据需要进行人工标注或者通过semi-supervsied的手段得到可使用的数据源,在处理时需要熟练使用opencv工具包,还有imagenet这种pretrain的模型。
- 客户产品类数据
电商平台会记录用户搜索的关键词,浏览的产品页面,曾经交易的订单品类价格,以便更好的推荐产品和优惠活动;金融科技公司会搜集用户的各类数据去评估用户信用和欺诈风险,保障用户的账户安全。由于客户产品类数据来源非常杂乱,格式千差万别,把数据归一化到用户或产品维度本身就是个技术活,然后还需要把客户产品背后的业务逻辑梳理清楚。
- 地理信息类数据
当你在网上购物,点外卖,打出租车的时候,大量的模型在计算最优的物流路线,预测路程时间,这些都离不开地图,POI和GPS这些地理信息类的数据。地理信息数据有着领域标准化的格式,比如地图都会按特定的格式存储分享,有着地理信息处理的特定的软件ArcGIS, QGIS,还有比较复杂的可视化的工具,在地图上做可视化需要更多的工程化的工作。
3数据岗位成长路线
芝麻开门:作为数据分析师或数据科学家,在入职前一般需要先参加相关数据比赛和实习项目,积攒相关项目经验,这会大大提升你的面试成功率。
初入职场:真正进入公司后,一般先跟着前辈参与一些小项目,承担部分数据分析和建模的工作,按照要求完成相关的开发任务。在此过程中,你会学习相关的软件工具和业务知识,并对所需要的数据有一定了解。
独当一面:当你参与了一两个项目并对公司数据和整体工具熟悉后,就会独立承担一项数据服务工作,了解需求方的要求,制定对应的解决方案,按时按质交付工作,撰写相关文档和报表。如果是建模工作的话,还需要完成模型上线和监控迭代的工作。
打怪升级:当你能很好的独立完成工作后,就会带领团队合作承担一个业务线上的若干项目。这时不仅对数据分析和建模等工具型技能有较高的要求,更大的挑战来对自业务的理解及与团队的沟通。这一阶段,你需要能够精准定位业务瓶颈,并能从数据角度给出建设性意见,在现有的人力和时间限制下,完成所提出的解决方案。
总的来说,数据工作分为数据分析师和数据科学家两大岗位。除了必要的工具型技能外,因为业务场景不同,所接触的数据及其对应的分析建模方法有很大不同。在成为一个资深的数据从业人员的道路上,除了要不断去提升自己的工具型技能外,更多的需要深入业务数据,通过团队协作解决业务痛点问题,真正把数据转化为有价值的生产力!
4直播推荐
如果想知道数据科学有哪些你能胜任的职位?数据科学未来的前景怎么样?更多详细的内容都在3月4日举办的公开课,由5年数据化风控的相关工作经验的Ollie老师,以及多年人力资源工作经验的Mabel老师一起给你详细的解答!扫下方图片二维码即可报名!