일반 리서치 엔지니어(5년차)가 보는 딥갤의 논쟁거리: 수학, 일자리, 전망 - 토론 커뮤니티

커뮤니티 일반

리서치 엔지니어(5년차)가 보는 딥갤의 논쟁거리: 수학, 일자리, 전망

일단 아무것도 모르는 사람이 쓰는 것은 아니라는 것을 어필하기 위해 간략히 소개하면 SPK 학/석하고 업계 +4년 이상 되었고 대부분 1저자 피인용수 100 언저리인

탑급도 아니고 그렇다고 뭣모르는 것도 아니고 적당히 잘 알고 다양한 분야 경험이 많음 (컴퓨터 아키텍처, GPU 클러스터 등 하드웨어적인 것부터 생성 모델 등 수학적인 것까지)

논쟁이 되는 글들에서 정말 허튼 소리하는 글도 많고 암것도 모르는 애들이 저거보고 끄덕거릴까봐 노파심에 씀

1. 수학

컴/수학 복전함.

수학이 필요없다는 이상한 소리가 많은데, 진짜 희대의 개소리라고 생각한다.

오히려 AI 관련해서 일을 할 때 과하게 알면 더 좋다고 생각하는 것이 수학이다.

그럼 왜 중요하나?

논문은 연구자가 아이디어를 제안하고 검증하기까지 수많은 시행착오가 함축되어있고 심지어 제안된 아이디어에 대한 여러 해석이 있더라도 그 중 하나를 택해 압축한 구조이다.

논문을 이해하는데 있어서는 단순히 수학적 notation만 알고 있어도 큰 무리가 없다.

하지만, 그런 아이디어가 왜 나왔는지 이해를 하고 비판적 시야를 가지려면 수학이 필수적이다.

서비스 하는데는 수학 몰라도 돼요: 이건 프로세스가 갖춰진 집단에서 본인의 역할만 수행하면 되는 "엔지니어"의 포지션이다.

AI는 빼도 된다. 그냥 서비스의 영역이 AI일뿐인 것이다. 서비스를 효율적으로 구성하려면 논문을 읽을 줄 알아야 되고 그리고 어떤 방법론을 택할지는 비판적 시야로 여러 방법론을 평가할 수 있어야 된다.

두번째로 어떤 것을 공부해야되나?

선대랑 확통 정보면 충분해요. 아니다.

선대가 중요하다고 하는 이유는 그냥 기초적인 과목이고 벡터 미분을 이해하기에 편한 것, 그리고 고전적인 ML 방법론이 선대의 내용을 많이 응용해서 그런 것이다.

확통은 무조건적으로 중요한데, 확통만 알면 그냥 매일 "가우신안이~ " 하며 가우시안만 찾는다.

RL을 이해하려면 estimation theory가 필요하고 베이지안을 이해하려면 통계적 추론에 대한 이해는 필수다.

최근 AI 기반 화학/생물 쪽의 응용을 보려면 topology를 공부해야 수월한데, topology를 이해하려면 또 현대 대수학이 선수적으로 필요하다.

그럼에도 공통되게 가장 중요한 것을 꼽으라고 한다면 "수리통계학"이다. Fisher information이 뭔지는 알아야지.

2. 일자리

한국의 AI는 망해가고 있고 이미 망하기도 했다.

타이밍을 놓친 것도 크고 너무 일찍이 돈을 벌어오라고 기업들이 채찍질한 것도 크다.

훌륭한 리서처와 엔지니어는 꽤 많았는데 많은 사라믈이 미국으로 가버렸고, LLM만 하더라도 현재의 발전에 이르기까지 산 증인으로서 역사를 갖고 있던 사람들이 많이 흩어져버렸다.

이제 막 나오는 석/박사들 데리고 현재 레벨의 foundation model을 만들 역량도 부족하고 리소스도 없다.

그러면 응용 레벨에서 뭔가 해야 되는데 이 시장도 이상하게 국내에선 커지고 있지 않더라.

모든 타이밍이 다 안좋다.

그나마 AI 반도체가 활성화가 된 편인데, 엔비디아 발끝도 못 따라가고 있고 앞으로도 마찬가지일 것이다.

일자리는 그래도 응용 레벨에서 상품을 만들고 자잘한 것들에 끼워서 파는 방향으로 갈 것이고, 기업의 매출에서 AI 엔지니어가 기여하는 부분도 당연 적을테니 전망이 좋진 않다.

한국은 반도체가 강국이니 차라리 로봇이나 IoT 등 하드웨어적 요소가 섞인 것을 하는 것이 오히려 좋아 보인다.

링크트인가서 오픈 포지션만 봐도 infra/cloud 엔지니어는 많이 뽑아도 AI 엔지니어는 잘 안보일 정도로 기업들이 수동적이고 앞으로도 그럴 것이다.

대부분이 짜잔! 하고 멋진 것을 상품화를 할 능력이 없다.

3. 전망

위에도 말했지만 전망이 좋진 않다.

불과 내가 석사 졸업할 때만 하더라도 적당히 MNIST 분류를 CNN이나 MLP로 학습하고 구현잘하면 오오.. 하고 채용이 되었는데

지금은 LLM이니 physical ai니 하며 고도화가 되었다.

얄팍한 지식으로 취업하는 것은 이미 불가능하고, 기본기 탄탄하게 해서 엔지니어링이 아닌 과학으로 접근을 하며 공부를 해야 그나마 포지션을 찾기에 수월하다.

그것도 아니면 GPU에 대해서 엄청난 고수가 되어 시스템을 구축하는데에 커리어를 쌓는 것도 좋다고 본다.

분류기와 같은 discriminative model이 아니라 generative model을 온전하게 이해하고 연구 및 개발 경험을 쌓는 것이 좋다.

AI는 애초에 ML과는 다른 느낌이라, ML에서 많이 풀었던 분류 문제는 AI에서는 매력적이지 않다.

(data-driven 이라는 점에서는 같지만, ML은 학습을 통해 feature를 "선택"하는 것이고 AI는 feature를 "조합 및 재생산"하는 것이다.)

ML에서 못 푼 문제를 AI로 풀어야 살아남고, 더불어 그쪽의 전망도 밝다.

Data 관점에선 LLM은 계속 될 것이고 응용에서 RL의 시대가 열리고 있고 diffusion은 AI에서 많은 이론적인 기초를 더 쌓아줄 것이다.

CNN 돌려보고 BERT 돌려보고 나 "AI 엔지니어에요!"라고 말하는 시대는 한참 전에 지나갔다.

----

개인적으로는 AI 자체는 science의 영역으로 보고 있어서 가볍게 찍어 먹으며 들어오는 분야는 아니라고 생각한다.

그럴 생각이면 차라리 관련된 엔지니어링 영역에서 기술 스택을 쌓는 것이 커리어에 훨씬 도움 될 것이다.

(ChatGPT가 다 해줄텐데요? 개소리. 아직 멀었다.)

글쓴이의 작성글 감추기

댓글 쓰기 에디터 사용하기 닫기

view_headline 목록

SEARCH

리서치 엔지니어(5년차)가 보는 딥갤의 논쟁거리: 수학, 일자리, 전망

아테네 님의 최근 글

아테네 님의 최근 댓글