전체 글 45

ai tech 28일차

특강이므로 느낀점만 작성 할 수 있다고 한다. # 캐글 그랜드 마스터의 경진대회 노하우 캐글에서 좋은 성적을 얻으려면 좋은 장비가 필수라는것에 조금 놀랐다. 코랩 프로로 진행될 수 있을줄 알았는데, 데이터 입출력 속도가 느리기 때문에 코랩에 제한이 있다고 한다. 아담이 주로 사용되는것 같고, 많이 해봐야 되는게 답인것 같다. # Fullstack ML engineer 머신러닝 풀스택 엔지니어면 웹 백엔드와 프론트엔드도 할줄 알고 최종적으로 프로덕션도 만들수 있어야 한다고 한다. 나에게는 이 방향이 유리할 것 같다.

ai tech 2021.03.03

ai tech 27일차

# 서비스향 AI 모델 개발하기 실무에서는 데이터 모델링 작업은 전체 작업에서의 아주 일부분만 차지하고, 학습데이터셋부터 해서 모든 것을 다 만들어야 한다. 그리고 모델링 작업을 하나로 통째로 진행하는 것이 아니라 세분화하고 모듈화해서 각각의 기능을 하는 모델들을 개발하는 식으로 작업이 이루어진다. 요구사항을 시작으로 개발이 진행되는데, 처리시간, 목표정확도, 성능, 장비 사양 등 세부적인 내용까지 처음에 모두 확인하고 정리해야 개발 진행이 가능하다. 팀에는 데이터 큐레이터, 모델러, 프론트 개발자, 모델엔지니어, 백엔드 개발자 등 모델링을 위주로 하는 개발자보다도 서빙을 위한 개발자들이 더 수요가 많고 필요하다. # AI 커리어 역시나 팀에는 모델링 하는 사람 뿐만 아니라 데이터 엔지니어, 개발자 등 ..

ai tech 2021.03.02

ai tech 25일차

# 정점 표현 학습 정점 표현학습은 그래프의 정점들을 벡터의 형태로 표현하는 것이다. 그래서 정점 임베딩이라고 부르기도 한다. 그래프에서의 정점간 유사도를 임베딩 공간에서도 보존해야 한다. 임베딩 공간에서는 내적을 해서 유사도를 구한다. 그래프에서의 두 정점의 유사도는 인접성, 거리, 경로, 중첩, 임의보행 기반 접근법으로 나뉜다. 여태까지의 정점 임베딩 방법들은 변환식 방법이다. 변환식 방법은 학습의 결과로 정점의 임베딩 자체를 얻는다. 귀납식 방법은 정점을 임베딩으로 변화시키는 함수, 인코더 자체를 얻는다. # 변환식 임베딩 방법의 한계 1. 학습이 진행된 이후에 추가된 정점에 대해서는 임베딩을 얻을 수 없다. 2. 모든 정점에 대한 임베딩을 미리 계산하여 저장해두어야 한다. 3. 정점이 속성 정보를..

ai tech 2021.02.26

ai tech 24일차

# 정점 표현 학습 그래프의 정점들을 벡터의 형태로 표현하는 것이다. 정점 임베딩이라고도 부르는데, 정점을 벡터공간에 임베딩하는 것이다. # 정점 표현 학습의 이유 다양한 벡터 형태의 데이터를 위한 도구들을 사용할 수 있다. # 정점 표현 학습의 목표 # 인접성 기반 접근법 # 거리 기반 접근법 위에서는 거리가 2일때까지는 유사도가 1이고, 2를 초과하는 경우에는 유사도가 0이 된다. # 경로 기반 접근법 # 중첩 기반 접근법 유명인처럼 연결성이 매우 높은 노드의 경우 가중치를 낮춘다. 연결성이 적은 노드의 경우 가중치를 높인다. # 임의보행 기반 접근법 일단 정점에서 출발시키고 그 결과를 리스트에 담는다. 임베딩으로 추정한 결과로 도달할 확률을 계산한다. 그 확률과 실제 출발해서 리스트에 담길 확률의 ..

카테고리 없음 2021.02.25

ai tech 23일차

# 군집 다음 조건들을 만족하는 정점들의 집합이다. 1. 집합에 속하는 정점 사이에는 많은 간선이 존재한다. 2. 집합에 속하는 정점과 그렇지 않은 정점 사이에는 적은 수의 간선이 존재한다. 많고 적은 것이 모호하기 때문에 수학적으로 엄밀한 정의는 아니다. # 실제 그래프에서의 군집 온라인 소셜 네트워크에서의 군집은 사회적 무리(social circle)들을 의미하는 경우가 많다. 부정행위와 관련된 경우도 있다. 트위터에서 부정행위와 관련된 계정은 다른 부정행위와 관련된 계정과 팔로우 되어있는 경우가 많다. 조직 내의 분란이 소셜 네트워크 상의 군집으로 표현되는 경우도 있다. 아래 그림에서 동아리가 두개 군집으로 나뉘어져 있다. 인접행렬으로 나타내게되면 0이 아닌값들이 몰려있는 것을 확인할 수 있다. 키..

카테고리 없음 2021.02.24