SuJin Seong

프로필사진


NLP Researcher, Korean

nous645@gmail.com

Education

Integrated Ph.D. 컴퓨터・정보통신 전공
March 2019 ~ February 2024
B.S. 컴퓨터공학과
March 2015 ~ February 2019

 

Skills

Python
  • 주력 언어
  • 데이터 수집부터 딥러닝 모델 개발 등 다양한 작업 수행 가능
  • PyTorch
  • HuggingFace Transformers 사용 및 수정 가능
  • 딥러닝 분야 논문 내용 구현 가능
  • Linux
  • 리눅스 CLI 환경에서 프로그램 개발 가능
  • Ubuntu 환경 설정 및 오류 대응 가능 / docker를 활용하여 다양한 운영체제에서 개발 가능
  • NLP
  • BERT, GPT, T5와 같은 다양한 Transformers 모델 변형에 대한 실험 및 개선 경험
  • Retrieval-Augmented Generation 중 하나인 REALM 모델 구현 경험
  • MeCab, nltk, Espresso 등을 활용한 형태소 분석과 같은 자연어처리 가능
  •  

    Projects

    참여 연구원 (2017. 01. ~ 2024. 02.)

    Dynamic Mini-Batch Sampling for Imbalanced Datagithub    /    paper
    Adapted Domain Vocabulary for Out-of-Vocabularygithub    /    paper
    Retriever-based Few-shot Classificationgithub    /    paper
    Science & Technology NERpaper
    Keyword-to-Text for Supporting Factspaper

    참여과제 목록

    2023.04. ~ 2023.10.
    과학기술 논문 조사 분석을 위한 딥러닝 기반 논문 패싯 추출 기술 연구
  • Retriever-Augmented Generator 기반 모델 연구 및 개발
  • 과학기술 논문 도메인의 다중 클래스 다중 레이블 분류 기준 정의 및 데이터 구축
  • 2022.04. ~ 2023.12.
    보이스피싱 정보 수집・가공 및 빅데이터 기반 수사지원시스템 개발
  • 과제 제안서 작성 및 베이스라인 실험 결과 확인
  • 보이스피싱 전사 데이터 및 범죄 기록 내 유사 문서 검색을 위한 벡터 검색 시스템 설계
  • 2022.04. ~ 2022.10.
    과학기술분야 사전학습 언어모델 고도화 및 어휘확장 기술 연구
  • 공개 PLM을 전문 도메인으로 확장하기 위한 고도화 기술 연구 및 어휘확장 기술 개발
  • 과학기술 분야 상세개체 태깅 레이블 정의 및 데이터 구축
  • 과학기술 분야 상세개체 레이블 정의를 위한 용어 사전 수집
  • 2021.04. ~ 2022.12.
    비정형 텍스트를 학습하여 쟁점 별 사실과 논리적 근거 추론이 가능한 인공지능 원천기술
  • 문서 및 관계정보 기반 응답 및 근거 문장 생성 모델 개발
  • 전체 연구 개발 결과에 대한 통합 웹 시연 페이지 설계 및 구축
  • 법률 도메인 근거 문장을 포함하는 질의응답 데이터 구축을 위한 관계정보 및 가이드라인 정의
  • 2021.04. ~ 2021.11.
    위험 상황 초기 인지를 위한 ICT 기반의 범죄 위험도 예측 및 대응 기술 개발
  • 범죄 유형 및 위험도 분류 모델 개발
  • 극단적 불균형 데이터 분류 모델 개선 방법 설계 및 개발
  • 2021.04. ~ 2021.11.
    과학기술 논문 조사 분석을 위한 딥러닝 기술 적용 연구
  • 과학기술 분야 문서 내 용어 유형 및 분야 태깅 데이터 구축
  • 용어 유형・분야 태깅 모델 및 논문 문장 의미 분류 모델 개발
  • 2020.04. ~ 2020.10.
    Data skewness에 강건한 분류 및 예측 기술 선행 연구
  • 정규표현식 형식의 분류 규칙을 포함하는 로직 모듈 개발
  • 2020.03. ~ 2020.09.
    딥러닝 기반 이슈 요약 생성 기술 개발
  • 뉴스 문장 및 단락에 대한 감성 분석 모델 개발
  • 뉴스 제목 및 요약문 생성 모델 개발
  • 뉴스 문장 감성 분석 데이터 및 제목, 요약문 생성 데이터 구축
  • 2019.04. ~ 2020.12.
    마취분야용 의료 딥러닝을 활용한 인공지능 및 인터랙티브 OCS KIOSK 시스템 개발
  • 실시간 의료 데이터 기반 마취 처치 추천 모델 개발
  • 실시간 바이탈 정보 저장 데이터베이스 설계
  • KIOSK 프로그램 UI 설계
  • 2018.06. ~ 2018.11.
    시계열 데이터 기반 위험도 추론 및 유사 범죄 예측 기술 선행 연구
  • 범죄 유형 및 위험도를 분류하는 Multi-Task Learning 모델 개발
  • 2017.01. ~ 2017.12.
    IOT 융합기반 청정지역 1차 산업 생산관리 SW 고도화 기술 개
  • 굴 생산량 예측을 위한 데이터 분석 및 선형 회귀 모델 개발
  • 노로바이러스 예측을 위한 기상 정보 수집 및 선형 회귀 모델 개발
  • Patents

    Publications

    [more]
    • 성수진, 차정원. “리워드를 이용한 설명 가능 마취용 처치 추천 딥뉴럴 네트워크.” 한국정보과학회 학술발표논문집 (2020): 448-450.

    • 성수진, 권수범, 윤지욱, 오진영, 차정원. “마취용 처치 추천을 위한 설명 가능한 딥뉴럴 네트워크.” 정보과학회 컴퓨팅의 실제 논문지 26, no. 12 (2020): 550-555, 10.5626/KTCP.2020.26.12.550

    • 성수진, 이승우, 차정원. “단어 손실함수를 추가한 트랜스포머 인코더-디코더 기반의 제목 생성 모델.” 한국정보과학회 학술발표논문집 (2020): 416-418.

    • 성수진, 귄수범, 윤지욱, 오진영, 차정원. “마취용 처치 추천을 위한 설명 가능한 딥뉴럴 네트워크.” 한국정보과학회 학술발표논문집 (2019): 536-538.

    • 성수진, 차정원, “깊이에 따른 중간 단계 분류기 내부 학습 경향 분석 및 고찰”, 제 31 회 한글 및 한국어 정보처리 학술대회 논문집 (2019): 115-119.

    • 성수진, 방준성, 차정원. “합성곱 신경망 구조를 이용한 문서 범주 관련 키워드 추출.” 한국정보과학회 학술발표논문집 (2019): 599-601.

    • 성수진, 박성재, 정인규, 차정원, “Multi-Task Learning 에서 공유 공간과 성능과의 관계 탐구”, 제 30 회 한글 및 한국어 정보처리 학술대회 논문집 (2018): 305-309.

    • 성수진, 신창욱, 박성재, 차정원, “CNN Sequence-to-Sequence 를 이용한 대화 시스템 생성”, 제 30 회 한글 및 한국어 정보처리 학술대회 논문집 (2018): 151-154.

    • Su-Jin Seong, Seong-Jae Park, Tae-Ho Park, Chang-Uk Shin, Da-Sol Park, Jeong-Moo Kim, Jeong-Won Cha. “Epidemic Respiratory Disease Prediction Using Ensemble Method.” INTERNATIONAL CONFERENCE ON FUTURE INFORMATION & COMMUNICATION ENGINEERING 10, no. 1 (2018): 253-256.

    • 성수진, 박성재, 차정원. “일별 굴 생산량의 예측 가능성에 관한 연구.” 한국정보과학회 학술발표논문집 (2017): 904-906.