트랜드를 읽어주는 팟캐스트 생성
·
프로젝트 회고
프로젝트 소개프로젝트 : 비타민 14기 최종 프로젝트 컨퍼런스 (대상)기간 : 2개월 (25. 06. 29 ~ 25. 08. 23)인원 : 4명김영홍 : MCP 연동, 쿼리 및 보고서 생성김민열 : 팀장, RAG 검색배한준 : AI 워크플로우 연결김홍재 : 총괄 기획 및 서칭 에이전트 데이터 수집유저 데이터: 최근 카카오테크 부트캠프에서 MAS 구조를 사용한 챗봇을 도입하였으며, GPU 사용량과 최적화의 트러블 슈팅을 진행함 데이터 출처: MCP를 사용하여 수집한 Slack, Notion, Gmail 데이터 모델링 전략MCP : Anthropic에서 발표한, LLM Agent가 오피스 프로그램, 터미널, 웹/앱 같은 프로그램 등 다른 프로그램과 연동하기 위한 프로토콜이다. 계속해서 최신화되는 Notio..
NAVER Cloud AI DevDay
·
배움 일기
2025년 7월 15일 선릉에서 NAVER Cloud AI DevDay가 개최되었다. 현장으로 참여하지는 않았지만, Agentic AI와 Multi-Agent 등 요즘 AI 트랜드에 대한 주제가 눈에 띄어서 강의를 듣고 배운 점과 느낀 점을 정리하였다. 네이버 클라우드 블로그와 유튜브에 강의 내용 정리와 다시보기가 있으니 확인해보면 좋을 것 같다. (https://blog.naver.com/n_cloudplatform/223938853841?trackingCode=rss) 나는 현재 내가 관심있는 분야 다음 분야의 강의만 확인하였다.네이버클라우드 기술교육팀 강지나 님의 "지금 주목할 LLM 기술 흐름과 생성형 AI 적용 인사이트"솔루션 아키텍트 허창현 님의 "Multi-AI Agent 아키텍처와 구현 전..
Language Models are Few-Shot Learners
·
논문 리뷰 스터디/자연어 처리
https://arxiv.org/abs/2005.14165
카카오테크 부트캠프 in 판교 2기 | 수료 및 느낀 점
·
배움 일기
부하테스트카카오테크 부트캠프에서 오프라인 과정 초반에 해커톤을 진행했다면, 후반부에는 2박 3일 부하테스트가 있다. 운영진에서 기본 베이스 코드를 제공해주는데, 이 코드를 바탕으로 성능을 개선시켜서 부하를 걸며 토너먼트를 진행한다. 기본 베이스 코드는 AI 멘션 기능이 있는 채팅 서비스가 주어졌으며, 몇가지 버그들도 포함하고 있었다. [코드](https://github.com/ywoo121/ktb-BootcampChat) 사실 인공지능 과정이고 클라우드에 대해서는 알고있는 지식이 많지 않아서, 부하테스트 쪽으로는 거의 할 수 있는 것이 없었다. 그래서 우리 팀에서는 클라우드 분들이 고생을 오로지 감내했어야 해서 죄송할 뿐이었다... 다만, 이렇게 역할이 적은 과정이 있기 때문에 버그 픽스, 기술 혁신이라..
Nexon Recommendation Interview
·
배움 일기
들어가며지난 2024년 11월, 비타민 선배님들 중 현직에서 실무를 하고 계시는 분들을 초청하여 강연을 듣는 자리 있었다. 비타민 2기의 넥슨 추천팀에서 근무하시는 선배님의 명함을 쉬는 시간에 받았었는데, 마침 판교에서 카카오테크 부트캠프를 하고 있고 게임, 데이터 분석, AI에 관심이 있는 동료도 주변에 많이 생겨서 메일로 멘토링 시간을 요청드릴 수 있었다! 귀중한 시간 내주셔서 정말 감사했다. 사전 공부찾아 뵙기 전, 넥슨 데이터 분석가 직무 공고를 확인했더니 다음과 같았다.데이터 분석 경험이 있으신 분 (분석 실무 경력, 분석 분야 입상 경험, 개인 프로젝트 등)Spark, Zeppelin, Airflow, Tableau 활용 경험과 이해가 있으신 분통계학 및 데이터 분석 관련 학위가 있거나 이에 ..
한국어 맞춤법 교정 전략 탐색
·
프로젝트 일기
형태소 분석 및 품사 태깅한국어 맞춤법 규정은 형태소, 음운 등을 바탕으로 이루어진 조건 트리이다. 때문에 비문을 입력받고, 이를 교정하기 위해서는 문장을 어절, 형태소 단위로 쪼개고 이에 품사를 부여하는 태깅 작업이 필요하다. (POS-tagging)기본적으로 한국어는 5언 9품사 (체언 : 명사, 대명사, 수사, 용언 : 동사, 형용사, 수식언 : 관형사, 부사, 관계언 : 조사, 독립업 : 감탄사)에 뿌리를 두고 있지만, 모든 한국어의 규칙을 9개 체계로 설명하기에는 턱없이 부족하다. 때문에 한국어 NLP 오픈소스 라이브러리는 세종프로젝트 (23POS),심광석 프로젝트 (15POS) 등의 태그를 사용한다. 한국어 형태소 품사 태깅은 KoNLPy 라이브러리 내의 Hannanu, Kkma, Komora..
카카오테크 부트캠프 in 판교 2기 | 네트워킹 데이
·
배움 일기
Keep[25.06.26]Kakao AI추천플랫폼 John과의 멘토링 자리에서 포트폴리오, AI 엔지니어가 알고리즘과 관련된 공부를 어느정도로 해야할지 조언을 구했다. 결국 좋은 회사일 수록 ML 지식이나 고도화 된 지식을 물어볼 것이고, 취직이 급한 곳에서는 백엔드 쪽 질문이 많아질 것이라고... [25.06.27]Goorm Ilium 특강을 통해 최신 코딩테스트 트렌드의 메타가 변화하고 있음을 배웠다. 과연 알고리즘 문제를 푸는 것이 개발자 역량을 평가하기 위해 좋은 테스트가 맞는가? 때문에 사이킷 런을 이용해 머신러닝 파이프라인을 만들도록 시키거나, LLM 챗봇을 제작하도록 시키거나, 아니면 과제형 테스트를 많이 고려하고 있음. 기업들에서도 코딩테스트 문제 만들고 채점하고 하는 것이 다 비용이기 때..
스마트 그늘막 입지 선정 (2025 영천시 공공데이터 활용 경진대회)
·
프로젝트 회고
여름철 무더위가 해를 거듭할 수록 심해지고 있다. 기상청과 IPCC 보고서에 따르면, 산업화 이후 지구 평균기온은 1.1℃ 상승했으며, 2040년까지 1.5℃에 상승할 것으로 예측된다. 국내 평균기온은 지난 100년간 1.6℃ 상승했고, 2018년에는 온열질환자 수가 4,526명으로 급증하는 등 폭염은 실질적인 건강 위협으로 작용하고 있다. 따라서 시민들로 부터 호평을 받고 있는 교차로에 스마트 그늘막을 선정하는 입지선정 데이터 분석을 진행하였다. 프로젝트 소개인원 : 4 명 (팀장, 데이터 수집 및 WBGT 변수 추정 담당)기간 : 2개월 (25. 04. 09 ~ 25. 06. 13) 데이터 수집데이터 설명링크기상청 기후 데이터https://apihub.kma.go.kr/인구 분포 / 건물 높이 격자 ..
광역버스 잔여좌석 예측 (2025 국토교통 데이터 활용 경진대회)
·
프로젝트 회고
2022년 광역버스 입석 금지 제도가 시행된 이후, 출퇴근시간 잔여 좌석이 없어 대기 시간이 하염 없이 길어지는 속상한 날들이 생겨났다. 실시간으로 광역버스의 잔여 좌석수와 위치 정보를 수집하여 현재 사용자가 위치한 버스 정거장에 도달하였을 때의 남은 잔여 좌석 수를 예측한다면 사용자 편의에 큰 도움이 될 것이다. 프로젝트 소개기간 : 2025년 3월 24일 ~ 2025년 5월 23일역할분담실시간 버스 데이터 수집 : 김영홍기후, 공휴일 데이터 적용 : 최상록LSTM 잔여좌석 예측 : 민채영 데이터 수집데이터 정보링크경기도 버스위치정보 조회https://www.gbis.go.kr/gbis2014/publicService.action?cmd=openApiInfo기상청 단기 예보 자료https://data...
전기 자전거 충전소 MCLP (2025 세종시 공공데이터 창업경진대회)
·
프로젝트 회고
퍼스널 모빌리티가 주요 산업 중 하나로 부상하면서, 전기 자전거에 대한 관심이 높아졌습니다. 국내 전기 자전거 판매량은 2018년 2만 4천 대에서 2022년 10만 7천 대로 약 4.5배 증가했으며, 2025년 1월 2일 미국 언론사 CBS에 따르면 뉴욕시는 공공 전기자전거 충전소를 제공하는 프로그램을 확대한다고 밝히는 등 세계 각지에서도 이에 대한 필요성을 느끼고 있다. 세종시 행정중심복합도시 (행복도시)는 전국 최고 수준의 자전거 인프라를 갖추고 있는 도시로써, 이를 활용하기 위한 아이디어를 제안했습니다. 프로젝트 소개기간 : 2025년 4월 3일 ~ 2025년 5월 8일역할 분담LDA 댓글 분석 : 민채영POI 데이터 수집 및 KDE 계산 : 김영홍MCLP 입지선정 : 최상록 데이터 수집세종특별자..