본문 바로가기

스타트업 투자/데이터 + 테크

패스트캠퍼스 환급챌린지 17일차 : 문제정의능력 강의 후기

by Sungwook Choi 2025. 4. 17.

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.

*_1. 학습 인증샷 4장 이상 포함
*_① 오늘자 날짜, 공부 시작 시각 포함 사진 1장

② 오늘자 날짜, 공부 종료 시각 포함 사진 1장

③ 1개 클립 수강 인증 사진 (강의장 목록 캡쳐, 강의 내용이 담긴 수강화면이 보이지 않도록) 1장

④ 학습 인증샷 1장 이상 (ex. 필기 촬영, 작업물, 등)

2. 학습 후기 700자 이상 (공백 제외)

기업에서 AI엔지니어가 하는 일

  • 신규 서비스 기획 : 해당 서비스로 얻을 수 있는 기대효과와 필요한 기술 1차 정의
  • 의사 결정 지원 : 신규 서비스 기획을 바탕으로 기한 내 현실적으로 가능한 부분과 가능하지 않은 부분을 빠르게 결정 지원
  • 개발/이슈 해결 : 의사 결정을 바탕으로 서비스 개발 및 지속적인 이슈 해결
  • 지원 및 운영 : 상위의 활동을 지원 및 운영하기 위한 인프라 전문가 육성 및 영입

문제 분석과 모델 선택

  • 문제의 본질과 난이도 파악
    • 태스크 유형 분석 (분류, 생성, 추론)
    • 데이터 특성 파악
    • 도메인 복잡성 평가
    • 핵심 요구사항 정의
  • 최적의 모델 아키텍처
    • 빠른 임베딩 모델 : E5, BGE (BERT)
    • 생성 : Llama, Qwen, Gemma
    • 복잡한 추론 : GPT-4o, Claude, o1
  • 리소스 고려사항
    • 컴퓨팅 자원 : GPU 가용성
    • 시간 제약 : 개발/추론 속도
    • 배포환경: 클라우드/로컬
  • 데이터 확보 전략 수집
    • 문제의 본질과 난이도 파악
      • GPT-4 or Claude 활용 유무
      • 데이터 생성: 키워드로부터 신규 생성
      • 데이터 증강: 기존 데이터 변형
    • 프롬프트 엔지니어링
      • Few-shot: 예제를 적극 활용
      • Chain-of-Thought: 단계적 추론
      • 역할 부여: 페르소나 프롬프트
      • 생성된 데이터 검증 프롬프트
    • 데이터 품질관리
      • 다양성 확보 : 표현/문체/길이 변화
      • 편향성 검토: 데이터 편향 검증
      • 일관성 검증: 레이블링 기준 확인
      • LLM이 검증하는 프로세스
  • 효율적인 모델 튜닝
    • 최적의 학습 방법 선택
      • Full Fine-tuning : 모든 파라미터 조정
      • PEFT: 일부 파라미터만 조정
        • LoRA: 추가 파라미터만 조정
    • 하이퍼파라미터 최적화
      • 학습률 : 적합한 값과 스케쥴링
        • Learning rate/LR이라 부름
        • 1e-4부터 그 이하의 값 사용
      • 배치 크기: 병렬 학습할 데이터의 양
    • 또 다른 튜닝 선택지들
      • QLoRA: 양자화 + LoRA 조합
      • DPO: 선호도 기반 최적화
  • 성능 평가 및 최적화
    • 정확한 평가 지표 선정
      • 분류 : 정확도, F1, AUC
      • 생성 : LLM 기반의 평가 (LLM 답변을 LLM한테 평가시킴)
    • Safety 이슈
      • 환각 측정: 사실 정확성 평가
      • 안전성: 유해 출력 저항성
      • 편향성: 다양한 집단 공정성
    • LLM 생성의 오류 분석 및 개선
      • 오류 패턴: 실패 사례 분류
      • 원인 분석: 근본 문제 파악 (대부분 데이터 이슈)
      • 타켓 데이터: 특화 데이터 보강
  • LLM 기반 문제 해결 능력
    • 문제 분석부터 모델 선택, 데이터 확보, 튜닝, 평가까지 전체 AI개발 과정을 체계적으로 수행하는 종합적 능력
    • 효율성
      • 한정된 리소스 시간 내에서 최적 결과를 도출할 방법을 찾아내는 능력
    • 적응성
      • 다양한 도메인과 태스크에 유연하게 대응할 수 있는 능력
    • 확장성
      • 소형 모델부터 대형 모델까지 다양한 규모에 맞게 모델을 튜닝할 수 있는 능력

url : https://abit.ly/lisbva

댓글