반응형

데이터와 기계에 대한 인간의 의존도가 점점 더 높아지면서 데이터 과학이 급속도로 성장하고 있습니다.


계속해서 증가하는 데이터 환경과 방대한 데이터 세트를 처리해야 하는 필요성이 데이터 과학을 다양한 산업 분야에서 가장 높은 수준의 유망한 직업으로 만들고 있습니다.

 

 

 

 

이에 발 맞춰 많은 학생들이 대학 전공을 선택할 때 컴퓨터과학, 컴퓨터공학, 정보통신학, 기계공학, 통계학, 수학, 데이터융합공학, 응용소프트웨어공학, 정보기술공학 등 데이터 과학자로서 성장할 수 있는 공학·이학 계열에 초점을 맞추고 있습니다.

 

 

이는 과거 법 혹은 사회과학 분야를 선호하던 분위기와는 사뭇 차이가 있어 보일 수 있지만, 컨셉적으로 어느 한 도메인 그룹의 강세라기보다 사회 전반적으로 모든 분야에 있어서 IT(정보기술)·ICT(정보통신기술)가 기반이 되는 인문·사회·과학·기술 융합형 트렌드가 가속화되고 있음에 주목할 필요가 있습니다.

 

 

 

 

전세계적으로 원격 및 재택 근무의 비중이 커짐에 따라, 데이터 및 기계에 대한 의존도가 더욱 높아지고 특히 AWS, Azure 등의 클라우드 컴퓨팅 서비스에 기반한 인간과 디지털 인터페이스 간 상호작용이 급속히 증가하고 있습니다.

 

 

 

 

이것이 많은 조직들이 코딩 능력을 기반으로 데이터를 축출, (전)처리, 가공 및 평가할 데이터 엔지니어와 데이터 과학자를 적극적으로 찾고 있는 이유입니다.

 

 

 


데이터 과학자는 비즈니스와 IT 생태계 사이에서 비즈니스를 운영할 수 있는 잠재력을 가지고 있으며, 통찰력을 제공하기 위해 복잡한 데이터셋을 평가하여 산업을 주도합니다. 

 

 

데이터 사이언스 전문가의 수요는 계속해서 늘어나고 있으며, 이런 사회 전반 트렌드는 데이터 분석·AI 엔지니어·데이터 엔지니어 등 관련 분야에서 커리어를 쌓고자 희망하는 많은 이들에게 커리어 목표를 제공하고 있습니다.

빅데이터의 물결은 빠르게 가속화되고 있으며, 이 거대한 물결에서 승리(?)하려면 데이터를 깊이 파고들어 통찰력을 얻고 서로 간 공유할 수 있는 더 나은 이해와 지식 및 기술을 갖추어야 합니다. 

 

 

 

 

여기에서 데이터 과학은 데이터 분석, 데이터 마이닝, 예측 분석, 비즈니스 인텔리전스, 데이터 시각화, 통계, 머신·딥러닝 분석 등을 포괄합니다.
데이터 과학의 포지션으로는 다음과 같은 것들이 있습니다.

• 데이터 분석가
• 데이터 엔지니어
• AI 제품 관리자
• 데이터베이스 관리자
• 비즈니스 분석가
• 데이터 및 분석 관리자

 

 

 

 

위에서 딱 2개를 집어 "비즈니스 분석가"와 "데이터 엔지니어"를 놓고 본다면 둘은 분명 다루는 기술이나 초점을 맞추는 업무 영역에 큰 차이가 있습니다.

 

예를들어, 비즈니스 분석가의 경우, 물론 회사·부서·팀마다 다를 수 있지만 일반적으로 SQL과 BI도구(Tableau, PowerBI 등) 및 엑셀(VBA를 잘한다면 플러스), 조금 더 나아간다면 HIVE QL과 Python, R, 그리고 Airflow 등을 능숙하게 다룰 수 있으면 좋습니다.

 

 

물론 통계 모델링이나 A/B Testing 등에 대한 지식과 경험이 있거나 학습할 의지가 있다면 보다 확장적으로 다양한 업무를 수행할 수 있습니다.

 

 

 

 

이런 기술이 있는 전문가들에게 점점 더 많은 회사들이 쾌적하게 일할 수 있는 환경을 제공하는 것에 관심을 기울이고 있는데, 한 예로 전망이 좋은 쾌적한 장소에서 클라우드에 로그인 해서 큰 간섭없이 업무에 집중하는 비즈니스 분석가가 전세계적으로 수없이 많습니다. (물론 고용 계약을 맺은만큼, 100% 자율적 의지로 자유롭게 일하는 것은 아니며, 어느 정도 통제에 따라야 한다는 점은 기존과 동일합니다만, 과거 대비 업무 환경이 무척 쾌적해진 케이스가 무수히 많다는 것 또한 사실입니다)

 

 

 

 

SQL은 다시 또 여러 종류가 있지만 AWS Redshift, Teradata 등 어느 한 쿼리 언어를 잘 다루는 사람이라면 다른 쿼리 언어에는 금방 적응하는 특징이 있습니다.

 

 

 

 

반면 데이터 엔지니어는, 기본적으로 SQL에 능숙하고 특히 관여하고 있는 비즈니스 자체를 매우 상세히 잘 이해하고 있는 사람을 선호하는데 (신입의 경우 차이가 있음), 추가로 Python·JAVA·Linux 등을 능숙하게 다루고 Apache Spark와 같은 컴퓨팅 프레임워크를 잘 이해하고 있으며 데이터 아키텍쳐링 방법론을 잘 알고 있고 또 관련 경력이 있는 것을 매우 선호하는 경향이 있습니다.

 

 

 

 

물론 위에서 언급한 구체적인 언어나 프레임워크는 절대적인 것이 아니며 회사·부서·팀마다 차이가 있을 수 있고 또 시대에 따라 계속해서 변화 및 진화되고 있습니다.

 

AI 엔지니어링의 경우 또 차이가 있는데, 재미있는 사실은 AI가 위 두 영역 안으로 계속해서 확장하여 들어가고 있다는 사실입니다.

 

 

아파치 스파크 (출처: 위키백과)

 

 

사실 각 포지션에 있어서 기술과 업무 영역 측면에서 설명해야 하는 분량은 상당히 방대하다고 할 수 있습니다.

 

예를들어 AI 머신러닝 하나만 놓고 보더라도, 지도학습·비지도학습·강화학습과 관련된 책과 강의, 논문 및 프로그래밍 코드가 상당히 방대합니다.

 

 

또한 AI의 이미지 vs. 텍스트 처리 방식의 차이와 각각에 있어서 최신 기술을 잘 이해하기 위해서는 많은 연구와 실무 경험이 필요합니다.

 

이미지의 경우 OpenCV를 다룰 수 있는 능력을 요하는 포지션도 많습니다.

 

 

OpenCV (출처: 위키백과)

 

 

또한 자연어처리(NLP. Natural Language Processing)도 계속해서 진화하고 있는 방대한 분야입니다.

 

 

자연어처리 (출처: 위키백과)

 

 

데이터 과학자의 각 포지션을 뭉뚱그려 하나의 묶음 형태로 보여주는 경우도 있으나 사실 그 분류 기준에 있어서는 의견이 분분합니다.

 

데이터 과학과 AI를 별개로 보는 전문가들도 있습니다.

 

 

 

 

각 회사, 부서, 팀마다 요구하는 기술과 기타 요건이 다를 수 있으니, 취업 및 이직을 고려하시는 분들이라면 어떤 기술을 기반으로 자신의 스킬셋 중심을 잡을지 그 범위(scope)와 깊이(depth) 측면에서 충분히 리서치를 하고 고민 및 선택하여 파고드는 것이 권장됩니다.

끝.

반응형

+ Recent posts

error: Content is protected !!