전상민

Deeply Learning Engineer

ABOUT ME깊게 공부하고🔥 참신하게 생각해서🌌 재미있게 소통하는😁 개발자입니다. 차근차근 학습하기🎹를 선호하고, 해석적인 설명을 좋아합니다.💡 배움에 있어서는 질문들을 쌓아두고 확실히 해결한뒤📚 넘어가는 편입니다. 확실하고 세세한 지식을 얻기를 좋아하고🦅🦅 배운내용을 토의하고🤼‍♂️ 나누는 것을 좋아합니다. ESFJ👻

ABOUT ME

이름

전상민

생년월일

96.08.12

연락처

010-4388-7703

이메일

toxj17@naver.com

주소지

충북 청주시

학력

단국대학교 (소프트웨어학과)

취미

탁구

관심분야

NLP Research RecSys

SKILLS

Python

🟢🟢🟢🟢🟢 파이썬을 능숙하게 사용할 줄 압니다. 효율적인 코드를 좋아합니다. 메모리나 런타임 코드 리팩토링을 매우 신경씁니다. 대부분의 알고리즘 문제도 잘 풉니다. IDE는 파이참 프로를 사용합니다.

Linux

🟢🟢

기본적인 활용 능력을 갖추고 있습니다. 대부분의 기본 명령어는 검색 없이도 거의 사용하지만 좀 더 전문적이거나 세분화된 명령어까지는 검색이 필요한 정도의 수준입니다.

Github

🟢🟢🟢🟢 거의 모든 프로젝트를 깃허브로 관리했으며, PR과 Issue, Project와 Wiki를 활용해서 협업합니다. 협업을 잘 할수 있게끔 직관적이고 명료한 가이드라인을 짜는 편이며 깃허브답지 않게 깔끔하고 다채롭게 구성하려고 합니다.

Docker

🟢🟢 현재 딥러닝 개발 환경을 도커로 구성하고 있습니다. 파이썬 가상 환경보다는 리눅스 컨테이너 환경에서 작업하는 게 편해서 Jupyer Lab 이미지로 활용하고 있습니다.

PyTorch

🟢🟢 기본적인 Torch 명령어를 잘 활용할 수 있습니다. 모델 학습에 필요한 명령어도 잘 활용할 수 있으며 view나 contiguous와 같이 자주 쓰이는 함수를 사용할 수 있습니다. clamp나 gather같은 가끔 쓰이는 함수들은 검색이 필요합니다.

HuggingFace

🟢🟢🟢 HuggingFace 라이브러리를 이용해서 모델 학습을 진행할 수 있습니다. Wandb와 연동해서 결과를 확인할 수 있으며 dataset 라이브러리를 이용해 개인 데이터셋을 저장하고 불러올 수 있습니다.

Recommendation System

🟢🟢 컨텐츠 기반 필터링, 협업 필터링과 머신러닝 기반 추천 시스템을 공부했습니다. 현재는 Charu_C_Aggarwal의 추천시스템 교재를 가지고 공부중입니다.

PROJECTS

[Capston] Eyetracking

[Feb. 2020 - Jun. 2020] OpenCV, 손을 쓰지 않고 동공의 움직임, 깜빡임과 얼굴의 방향 전환으로 컴퓨터를 조작하는컴퓨팅 환경 프로그램 제작한 프로젝트입니다. dlib 라이브러리를 이용하여 얼굴과 동공을 인식하였고 Blink 모델을 이용해 동공의 깜빡임을 인식했습니다.

[Capston] Inpainting

[Jun. 2020 - Dec. 2020] OpenCV 등의 라이브러리와 MaskRCNN, Generative Inpainting 모델을 이용하여 이미지에서 특정 사람을 인식하여 마스크를 제공하고 선택된 인물을 제거 후 배경을 예측하여 자연스러운 결과의 이미지를 제공하며 이를 모바일 서비스 프로젝트입니다.

[AI School] Non-related Face Mosaic

[Feb. 2021 - Apr. 2021] 이미지나 동영상에서 일반인의 얼굴을 모자이크 하고 유명인의 얼굴 또는 유저가 등록한 얼굴만 등장할 수 있도록 하는 웹 서비스 입니다. OpenCV, dlib, Face-recognition, Face detection of Mediapipe 모델을 이용했습니다.

[부스트캠프] FooReivew

[Nov. 2021 - Dec. 2021] 음식점과 메뉴, 음식 평가와 배달 및 서비스 평가를 입력하면 해당 입력에 맞게 리뷰를 생성해주는 프로젝트입니다. 프로젝트의 PM을 맡았으며 개발에도 참여했습니다. 리뷰를 학습하여 해당 리뷰의 평점을 예측하는 모델을 구축했습니다. 기존 평점은 리뷰마다 편향이 심하고 이상치의 수가 너무 많았기 때문입니다. 또, 메뉴와 점수를 입력하면 리뷰를 생성하는 모델을 GPT2를 이용해 학습했습니다.

COMPETITIONS

[부스트캠프] Image Classification

[Aug. 2021 - Nov. 2021] 카메라로 비춰진 사람 얼굴 이미지만으로 이 사람이 마스크를 쓰고 있는지, 쓰지 않았는지, 정확히 쓴 것이 맞는지, 성별과 연령대는 어떻게 되는지를 예측하는 대회입니다. 최신 모델 중 구현하기 쉬우면서 성능이 매우 잘 나왔던 EfficientNet을 선택 했습니다. b5 부터는 pretrained model이 아니어서 가장 크기가 큰 b4 버전을 선택했습니다. 사람 얼굴을 겹쳐놓는 Cutmix를 구현하여 성능을 높였습니다. 또, 이미지에서 옷이나 배경을 자르고 얼굴만을 Crop하여 학습하여 성능을 높였습니다. 최종적으로, 38팀 중 F1 77점으로 4위를 달성했습니다.

[부스트캠프] KLUE/Relation Extraction

[Nov. 2021 - Oct. 2021] 주어진 문장과 문장의 단어(subject entity, object entity)를 이용하여, subject entity와 object entity가 어떤 관계가 있는지 예측하는 대회입니다. 데이터가 한글이었고 KLUE데이터 기반으로 작업된 데이터여서 KLUE/RoBERTa를 모델링했습니다. 실험은 small로 진행하고 주된 성능 평가는 large로 진행했습니다. 카카오의 Pororo모델을 사용하였는데 이 중 Back Translation을 이용하여 데이터 Augmentation을 하였습니다. 또, Typed Entity Marker를 추가하여 성능을 높였습니다. 최종적으로, 19팀 중 F1 72점으로 12위를 달성했습니다.

[부스트캠프] Open-Domain Question Answering

[Oct. 2021 - Nov. 2021] 주어지는 지문이 따로 존재하지 않고 사전에 구축되어 있는 Knowledge resource 에서 질문에 대답할 수 있는 문서를 찾을 수 있는 Retriever & Reader 시스템을 구축하는 대회입니다. KLUE/RoBERTa for QA를 가지고 모델링했습니다. 데이터 자체가 적은 대회여서 모델보다는 데이터가 관건인 대회였기 때문에 데이터의 수에 대해 많은 초점을 맞추었습니다. KorQuAD Question Generation과 Pororo Back Translation을 이용해 성능을 높였습니다. 또, LSTM과 CNN을 BERT에 부착해 성능을 높였습니다. 19팀 중 EM 70점으로 6위를 달성했습니다.

[AI Factory] 2021 기계독해 데이터셋 학습 알고리즘 개발

[Nov. 2021 - Dec. 2021] 주어지는 지문이 따로 존재하지 않고 사전에 구축되어있는 knowledge resource에서 다양한 종류의 질문에 대답할 수 있는 문서를 찾고 대답하는 대회입니다. Electra과 삼성 SDS QANet을 모델링 했습니다. 최종적으로 82명 중 F1 86.5점으로 5위를 달성했습니다.

EDUCATIONS

Dankook University

Software Development Department

2015.03~2021.02

Dankook University Automobile Security Lab

Software Development Department

2020.03.02~2021.11.27

Programmers AI School 1st

2020.11.30~2021.04.04

AI BoostCamp 2nd

NLP

2021.08.02~2021.12.27