이영주 교수

POSTECH

생성 AI 모델 경량화와 가속 시스템 최적화

[Abstract]

Transformer 기반 생성 AI 모델은 ChatGPT로 대표되는 large language model (LLM)의 상업적 성공 사례를 바탕으로 machine learning 분야에 새로운 방향성을 제시하고 있습니다. 하지만, 보다 높은 성능을 달성하는 과정에서 생성 AI 모델의 크기 역시 폭발적으로 커지고 있기에, 효율적인 inference 서비스 구현을 위한 모델 경량화의 중요성이 그 어느때보다 주목받고 있습니다. 본 발표에서는 생성 AI 모델에 적용할 수 있는 주요 모델 경량화 기법과, 이를 효과적으로 지원할 수 있는 새로운 가속 시스템 구조에 대해서 소개합니다.

이영주 교수, POSTECH

[Education]

2014 KAIST 전기및전자공학과 박사
2010 KAIST 전기및전자공학과 석사
2008 KAIST 전기및전자공학과 학사

[Career]

2017~현재 POSTECH 전자전기공학과 조교수/부교수
2015~2017 광운대학교 전자공학과 조교수
2014~2015 벨기에 IMEC 연구소 연구원

[Research Interest]

Embedded processor architecture
System-on-chip design
VLSI signal processing
Deep neural network
Communication algorithm

이영주 교수

이영주 교수, POSTECH

관련