머신러닝과 딥러닝에 대해 학습하던 중 Annotation이라는 단어가 자주 사용되어 정리를 하게 되었다. 

 

 

 

1) Annotation이란?


 사전적 정의로는 "주석"이라고 한다. 국어사전에는 다음과 같이 정리되어 있다.

 

  •  낱말이나 문장의 뜻을 쉽게 풀이함. 또는 그런 글

 프로그래밍 용어 또는 Data 측면에서 Annotation도 유사한 의미로 사용되지만, 좀 더 직관적으로 설명하자면 프로그래밍 언어에서는 코드에 대한 설명을 하기 위해 //(주석처리)를 사용하는 것이다. <그림 1>

 

&amp;amp;amp;lt;그림 1&amp;amp;amp;gt; 프로그래밍언어(C언어)에서의 주석처리

 

 그리고 Data측면 에서는 데이터에 대한 설명을 위해 Labeling을 하는 것이라고 보면 된다. Labeling이란 <그림 2>와 같이 이미지에서 객체 인식 시에 객체의 정보 즉, 메타데이터를 추가해 주는 것이라고 보면 된다. 

(Bounding_Box 위치값에 대한 라벨(Car, Person...) 표기) 

&amp;amp;amp;lt;그림 2&amp;amp;amp;gt; Data Labeling

 Annotation을 통해 상대방(프로그래머, 머신러닝 모델)이 코드나 데이터에 대해 쉽게 이해할 수 있게 만들어 주는 역할을 한다. 

 

 

 

2) Data Annotation의 종류


 Data의 측면에서 Annotation은 탐지하려는 객체를 표기하는 방식에 따라 구분지을 수 있다. 누끼 따는 것과 비슷하다.

 

① Bounding Box

 바운딩 박스는 object detection에서 가장 흔히 쓰이는 방법으로, 탐지하려는 객체에 타이트 하게 박스표기를 하고 해당 객체의 class를 구분해주는 방식이다. 대각선의 포인트를 잡아주면 되기 때문에 가장 쉽지만 데이터의 디테일이 그만큼 떨어진다.

 

 

② Polygon

 폴리곤은 의미 그대로 다각형이다. detection하려는 객체를 다각형으로 표기해준다. 레이블링(=어노테이션)에서 자세하고 디테일할수록 그만큼 좋은 데이터가 될 수 있지만, 그만큼 노동력이 많이 들어가게 된다. 

 

 

③ Point

 포인트는 이미지에서 찾으려는 객체에 대해 점을 찍어 표기하는 방식으로 점만 찍으면 됨으로 매우 쉽다. 하지만 그만큼 특징을 뽑아내는데 한정적이기 때문에, 정확하게 해당하는 데이터를 찍어주는 것이 중요하다. 찾으려고 하는 객체의 특성이 뚜렷한 경우에 효과가 좋고 이미지 안에서 객체의 수를 셀 때 유용하다. 

 

 

④Keypoint

  키포인트는 탐지하려는 객체의 모양을 알고싶을 때 데이터의 외곽선을 따줌으로써 폴리곤과 포인트 정보를 만들어 특징을 갖게 만드는 것이다. 추가적으로 포인트의 순서와 개수도 매타 데이터에 포함되기 때문에 동일 객체에 대해서는 같은 포인트를 갖는 것이 좋다.

 

 

⑤Polyline

 폴리라인은 많은 점으로 선을 그어 표기한다. 도로선 같이 시작과 끝이 없는 선을 구분할 때 사용하기 좋은 라벨링으로써 그 모양 자체로 특성을 가질 때 해당 데이터를 주로 사용한다. 예시와 같이 주로 차량 ADAS에서 자율주행을 위해 사용된다. 

 

 

⑥Cuboid

 큐보이드는 말 그대로 정육면체이다. 기존에 Bounding Box가 2차원으로 데이터를 형성하는 것이었다면, 차원을 하나 더 높여서 3차원의 데이터로 더 많은 정보를 제공할 수 있다. 자율주행 시스템에서 차량의 앞뒤 좌우를 표기하는데 매우 유용하고, 좋은 메타데이터가 많을수록 네트워크의 성능은 좋아질 수밖에 없다. 

 

 

 

 데이터 형식을 알고있으면, 추후 네트워크 목적에 따라 적절한 데이터 형식(Labeling, annotation)을 선정하는데 많은 도움이 될 것이다.  

 

 

 

*Reference 

- 네이버 지식백과 : https://terms.naver.com/entry.naver?docId=6470969&cid=42346&categoryId=42346

- 네이버 국어사전 : https://ko.dict.naver.com/#/entry/koko/e0f2adbb720242d488c38e79ad7c96b9

- https://humansintheloop.org/types-of-image-annotation/

 

 

부족하지만 읽어주셔서 감사합니다. 

'프로그래밍 > 머신러닝&딥러닝' 카테고리의 다른 글

Epoch, batch, iteration  (0) 2024.03.24
(용어 정리) Precision, Recall and Accuracy  (0) 2022.02.22

지난번 카카오 뱅크 투자에 대한 합리성을 분석하기 위해 타 은행과의 수익구조 분석 내용을 포스팅하려고 한다. 

 


 

1) 결론 

 

 결론부터 이야기 하면, 카카오 뱅크는 오버벨류 되어있다. "카카오" 브랜드 파워 덕분에...

 

 은행의 수익은 대출 이자에서 발생하게 되는데, 카카오 뱅크는 타 은행들에 비하여 회사 대출을 진행하지 않음으로 수익의 약 50% 수익 손실을 갖고 있고, 편리함과 신속함이라는 장점으로 개인대출(가계대출)의 포션을 얼마나 갖고 올 수 있을지는 미지수이다. 대출에서 중요한 점은 편리함과 신속함도 있겠지만, 이자가 매우 중요하기 때문이다.  

 

 카카오뱅크가 혁신적인 모델을 들고 올 때까지 방관하고 있어야겠다. 

 


 

2) 은행별 수익 분석

 

- 금융업 및 은행업에 종사하는 친구에게 물어본 바에 의하면, 은행의 수익은 대부분 대출의 이자에서 발생한다고 한다. 

실제 은행(국민은행, 카카오 뱅크)의 포괄손익을 대출금액에 비교하여 보면, 은행의 수익은 대출금에 비례한다. 즉 대출금의 크기가 수익으로 연결된다는 것이다.

 

<국민은행 포괄 손익 및 대출금액 데이터>

국민은행 제4기 제5기 제6기 3분기 비고
포괄손익 2,383,230 2,954,631 3,049,103 단위 백만원
대출금액 2,685,614 2,948,201 3,117,334 단위 억원

※ 다트 국민은행 2021 3분기 분기보고서

 

<카카오 뱅크 포괄 손익 및 대출금액 데이터>

카카오뱅크 제4기 제5기 제6기 3분기 비고
포괄손익 16,166 118,659 139,745 단위 백만원
대출금액 148,803 203,133 250,385 단위 억원

※ 다트 카카오뱅크 2021 3분기 분기보고서

 

 

 또한 은행 수익인 대출은 대출의 대상을 구분 지어 개인과 회사로 나눌 수 있는데, 국민은행 분기보고서에 따르면 개인과 회사의 대출규모는 대략 6:4 정도로 볼 수 있다. 자세하게는 개인의 대출 규모는 54~55%, 회사의 43~44% 정도로 구성되어있다. 이는 100% 가계대출로 구성되어있는 카카오뱅크의 대출규모는 타 은행에 비해 약 50% 적을 수밖에 없다. 카카오 뱅크의 수익성 개선을 위해서는 회사 대출을 추가하거나, 개인 대출 규모의 많은 부분을 갖고 와야 한다. 회사 대출을 추가하는 것은 영업점이 없는 것을 강점으로 갖고 가는 카카오뱅크에서 현실적으로 불가능하다. 회사 대출을 검토하기 위해서는 우선 회사의 데이터가 필요하고, 해당 대출 규모 및 이율을 판단하는 데에 필요한 데이터를 갖고 오기 위해선 실적이 필요한데 해당 데이터 베이스를 구축하는데 어려움이 따르기 때문이다. 결국 개인 대출 규모의 포션을 많이 차지하는 부분이 필요해질 텐데, 편리함으로 가계 대출의 포션을 차지하는 것이 가능할까?

 

<국민은행 용도별 대출금 데이터>

구 분 제21기 3분기 제20기 제19기
금액 구성비 금액 구성비 금액 구성비
기업자금대출 138,182,621 44.33 129,218,517 43.82 117,867,407 43.89
  운전자금대출 62,491,941 20.05 58,814,808 19.94 52,688,740 19.62
시설자금대출 75,690,680 24.28 70,403,709 23.88 65,178,667 24.27
특별자금대출 - - - - - -
가계자금대출 169,980,487 54.53 162,050,450 54.97 148,148,056 55.16
공공 및 기타 자금대출 2,984,410 0.96 2,905,668 0.99 2,422,959 0.90
  운전자금대출 1,899,981 0.61 1,846,669 0.63 1,386,259 0.52
시설자금대출 1,084,429 0.35 1,058,999 0.36 1,036,700 0.38
은행간대여금 585,832 0.19 645,503 0.22 122,950 0.05
합 계 311,733,350 100.00 294,820,138 100.00 268,561,372 100.00

주1) K-IFRS 연결재무제표 기준
주2) 원화대출금 기준

(단위 : 백만원, %)

 

<카카오뱅크 용도별 대출금 데이터>

구 분

제6기 3분기 제5기 제4기
금액 구성비 금액 구성비 금액 구성비
기업자금대출 - - - - - -
  운전자금대출 - - - - - -
시설자금대출 - - - - - -
특별자금대출 - - - - - -
가계자금대출 250,385 100.00 203,133 100.00 148,803 100.00
(주택자금대출) (80,418) (32.12) (44,868) (22.09) (24,179) (16.25)
공공 및 기타 자금대출 - - - - - -
  운전자금대출 - - - - - -
시설자금대출 - - - - - -
재형저축자금대출금 - - - - - -
은행간대여금 - - - - - -
합계 250,385 100.00 203,133 100.00 148,803 100.00

(단위: 억원, %)


 

3) 카카오뱅크의 미래

 카카오뱅크는 편리함과 신속함, 모바일, 24시간이라는 장점을 가지고 가계대출 시장에서 점유율을 늘려가고 있다. 하지만 이러한 장점들만으로는 투자에 대한 메리트가 부족하다. 혁신적인 새로운 모델이 나오기 전까지는 장기적으로 두고 바라봐야 할 듯하다. 

 

<4대 시중은행 및 인터넷전문은행(카카오뱅크, 케이뱅크) 간 원화대출금 점유율>

구 분 2020년 말 2019년 말 2018년 말
잔액 점유율 잔액 점유율 잔액 점유율
카카오뱅크 15.8 9.2 12.5 8.4 8.2 6.0
케이뱅크 2.7 1.6 1.4 1.0 1.2 0.9
국민은행 45.3 26.2 38.7 26.0 36.0 26.1
신한은행 44.4 25.7 38.8 26.0 36.0 26.1
하나은행 34.0 19.7 31.5 21.2 31.2 22.6
우리은행 30.3 17.6 25.9 17.4 25.1 18.3
합계 172.5 100.0 148.8 100.0 137.7 100.0

주1) 4대 시중은행 및 인터넷 전문은행(카카오 뱅크, 케이뱅크) 간 점유율

주2) 가계자금 신용대출 기준

주3) 금융통계정보시스템 말잔 기준

(단위: 조원, %)

 


 

*Reference

- 다트 (카카오뱅크, 국민은행) : https://dart.fss.or.kr/dsab007/main.do

 

 

 

부족하지만 읽어주셔서 감사합니다. 

'국내주식 > 카카오 뱅크' 카테고리의 다른 글

(1) 카카오 뱅크에 투자하는게 맞나?  (0) 2022.02.20

 직장에서 업무를 진행하던 중, 우연찮은 기회가 닿아 머신러닝/딥러닝 관련 TFT에 들어가게 되었다. 평소 관심은 있었지만 깊이 있는 공부가 부족했고 대화하는데 자꾸 귀에서 걸리는 단어들이 많아 이참에 하나씩 정리를 해보려 한다. 

 

 첫 번째로 정리해볼 단어는 Precision, Recall 그리고 Accuracy이다. 흔히 말하는 머신러닝/딥러닝 모델 활용 시 평가를 위해 사용하는 단어로 Pattern recognition이나 Classification에서 사용된다.

 본격적으로 Precision, Recall 그리고 Accuracy에 대해 이해하기 전에 간단한 예시를 들고 가려고 한다. 동전의 앞면과 뒷면을 구분하는 인공지능 모델이 있다고 할 때, 인공지능 모델이 내놓은 답에 대해서 총 4가지로 구분 지을 수 있다.

 

- 첫번째 : 실제 앞면인데 인공지능도 앞면(Positive)이라고 답했을 때 = True Positive

- 두번째 : 실제 뒷면인데 인공지능은 앞면(Positive)이라고 답했을 때 = False Positive

- 세번째 : 실제 앞면인데 인공지능은 뒷면(Negative)이라고 답했을 때 = False Negative

- 네번째 : 실제 뒷면인데 인공지능도 뒷면(Negative)이라고 답했을 때 = True Negative

 

※ 실제 값(Ground True)과 모델의 결과값이 일치하면 True, 불일치하면 False
※ 모델의 결과값이 긍정이면 Positive, 부정이면 Negative로 이해하면 좀 더 편할 것이다.

 

 

 

1) Precision(정확성)


 그렇다면 위의 TP/FP/FN/TN에서 Precision은 어떤 부분에 해당할까?

의미로 보면 모델이 앞면이라고 답한 것들 중에서 실제 앞면인 경우의 비율이다.

즉, Positive로 답한 것 중 실제 True Positive의 비율

 

                  TP (긍정 중에서 실제 정답)

Precision = -------

               TP+FP (긍정으로 답한 모든 것)

 

Precision이 높을수록 모델이 갖는 정확성은 높으나, 해당 모델이 놓친 부분 (Negative)에서도 실제 앞면이 많을 경우 좋은 모델이라 표현하기 어렵다. 따라서 Recall이라는 항목도 함께 살펴보아야 한다.

 

 

 

2) Recall(재현율)


 Recall의 의미는 실제 앞면 중에서 모델이 앞면이라고 예측한 경우의 비율이다. 

즉, True 중에서 모델의 True Positive의 비율

 

              TP (긍정 중에서 실제 정답)

Recall = -------

            TP+FN (실제 정답=Ground Truth)

 

따라서, 대부분의 분류 모델에서는 모델의 성능을 측정하기 위해 Precision과 Recall을 지표로 사용한다. 

 

 

 

3) Accuracy


 Accuracy는 주어진 모든 데이터에서(모든 앞면과 뒷면) 모델이 앞면, 뒷면임을 맞춘 것(=TP+TN)의 비율이다.

 

                TP+TN (모델이 실제로 맞춘 모든 데이터)

Accuracy = -------

                TP+FN+FP+TN (모든 데이터)

 

이는 Precision과 Recall 모두 TP에 대해 다루는 한계에 비해 Accuracy에서는 TN( 뒷면을 뒷면이라고 예측)에 대한 부분까지 고려하게 됩니다. 

 

 

 

 

*Reference

- 나무 위키(Precision & Recall) https://en.wikipedia.org/wiki/Precision_and_recall

 

 

부족한 글 읽어주셔서 감사합니다.

 

 

'프로그래밍 > 머신러닝&딥러닝' 카테고리의 다른 글

Epoch, batch, iteration  (0) 2024.03.24
(용어 정리) Data Annotation(Labeling)  (0) 2022.03.07

결론 : 현재 가격에 투자하는 것이 옳은가? No (판단 시점 : 22.03.01)

- 22.02.20

미지수, 추가적 분석을 통해 결론 내릴 예정, 현재는 간략한 카카오 뱅크의 개요 정도만 파악

YES or NO

 

- 22.03.01

 카카오뱅크는 카카오라는 브랜드에 의해 오버벨류 되어있다
 타은행에 비해 기업대출을 행하지 않음으로 대출규모에 있어 절반을 손해보고 있으며, 개인대출의 비율을 늘리고는 있지만 편리함으로는 한계가 있다고 판단한다. 새로운 수익 모델이 나올 때까지 지켜보고 있는 것이 좋을 것으로 판단한다.

2022.03.01 - [국내주식/카카오 뱅크] - (2) 카카오 뱅크에 투자하는게 맞나? - 가계대출만 하는 카카오뱅크에 투자하는 것이 맞나?

 


 

1) 카카오뱅크?

[생각보다 대출이 쉽네?(카카오 뱅크)]

 처음 카카오 뱅크에 관심을 갖게 된 것은 전세자금 대출을 하면서였다. 2019년 은행 이자가 매우 낮을 때, 전에 계약했던 집의 만기일이 도래해서 이사가 필요했다. 기존에 국민은행을 주 은행으로 사용하던 상황이라 해당 은행에서 대출을 진행하려 했으나, 직장을 다니면서 + 갑작스럽게 계약이 진행되는 상황에서 기존 은행의 대출 승인 기간은 너무 길었다. 최소 1~2주가 걸린다 했었고, 플랜 B로 생각하던 카카오 뱅크로 대출을 진행하게 되었다. 모바일을 통해 대출을 진행하니 심사 기간이 3일 정도 걸렸다. 절차도 매우 간단하고 휴대폰으로 접속하다 보니 별도 시간이 필요하지 않았다. 이때 느꼈다. 아! 이 주식이다!!

카카오뱅크 슬로건

은행의 새로운 시작까지는 모르겠지만 사용자 입장에서 매우 편하다는 것 하나는 확실하다.  

 

[카카오 뱅크에는 오프라인 점포가 없다?]

카카오 뱅크는 오프라인 점포를 운영하지 않고 모바일을 주요 영업망으로 운영하는 디지털 은행이다. 오프라인 점포에서 사용되는 비용들을 줄임으로 기존 은행들과의 차이를 갖는다. 

 

[카카오 뱅크의 두 가지 비즈니스]

해당 회사에서 진행하는 비즈니스는 크게 두 개이다. 첫 번째는 뱅킹 비즈니스와 다른 하나는 플랫폼 비즈니스이다. 

두 비즈니스 자체로는 기타 은행 브랜드와 차이가 없음으로 Pass, 하지만 두 비즈니스 자체가 회사에 타깃이 아니라 결국 일반 소비자를 대상으로 하며, 이를 통한 상대적 Loss가 있을 것으로 보인다.

(기존 은행들의 개인고객 및 회사 고객의 수익 비율 분석 및 업데이트 예정 - 완료)

2022.03.01 - [국내주식/카카오 뱅크] - (2) 카카오 뱅크에 투자하는게 맞나? - 가계대출만 하는 카카오뱅크에 투자하는 것이 맞나?

 

뱅킹 비즈니스  예금, 대출, 외화송금, 지급결제 등
플랫폼 비즈니스  주식계좌 개설, 제휴사 대출 추천, 제휴 신용카드 등

 

[카카오 뱅크의 장점]

- 접근하기 쉬운 UX/UI

- 오프라인 점포 미운영으로 해당 고정비 미발생

- 카카오 플랫폼 사용으로 넓은 확장성(카카오페이, 카카오, 두 나무 등 연결고리)

 

[카카오 뱅크의 단점]

- 기성 새대(40~50대) 접근이 어려움
   (실질적으로 은행의 실제 거래비용이 줄었는지 확인 필요)

- 기존 은행의 거래고객의 파이를 편리함으로 얼마나 갖고 올 수 있는가?

- 고객 대상이 회사 미포함, 일반 고객을 대상으로 함.

 


 

2) 수익구조는? 

 지속적으로 영업이익 및 당기순이익이 증가하고 있는 상태이다. 코로나로 인한 금리 인하 및 대출 증가가 가장 큰 이유라고 생각되나 원인에 대한 추가적 분석 필요하다. 

과목 6기 3분기 5기 3분기 5기 4기
Ⅳ. 영업이익 204,959,489,985 89,545,838,881 122,551,246,633 13,254,536,589
Ⅸ. 당기순이익 167,941,706,788 85,875,151,862 113,635,989,057 13,732,930,386

- 영업이익 : 매출 - (인건비+재료비)

- 당기순이익 : (영업이익 - 법인세) + 영업이익을 다른 투자로 번 수익, 손실

 


3) 카카오 뱅크의 미래는? 

 편리함이라는 장점으로 기존의 파이를 얼마나 갖고 올 수 있는가는 미지수이다. 은행을 선택하는 이유는 단순히 편리함 때문이 아니다. 그럼 카카오 뱅크가 다른 은행에 비해서 가질 수 있는 미래는 무엇인가? 편리함을 기반으로 한 디파이? 다양한 카카오 플랫폼(두나무, 카카오, 카카오페이)을 이용한 확장성? 새로운 수익 모델을 필요로 한다. 

 


4) 카카오 뱅크의 적정 주가는? 

현재가(2022.02.18 기준(장마감)) : 49,350원 

- 현재 주가는 얼마나 고/저평가되어있는가? 

- 평가의 기준을 무엇으로 갖고 가야 하는가? 

(주가 분석의 기준 정하기)

 


5) 추가 분석 예정 내용 

- (기존 은행들의 개인고객 및 회사 고객의 수익 비율 분석 및 업데이트 예정) - 완료

2022.03.01 - [국내주식/카카오 뱅크] - (2) 카카오 뱅크에 투자하는게 맞나? - 가계대출만 하는 카카오뱅크에 투자하는 것이 맞나?

- (실질적으로 은행의 실제 거래비용이 줄었는지 확인 필요)

- (Dart에서 재무제표 보는 법 공부하기)

- (주가 분석의 기준 정하기)

- (인플레이션에 따른 은행권 수익 영향 분석)

 

*Reference

- 카카오 뱅크 : https://www.kakaobank.com/Corp/About/Identity

- 나무 위키(카카오 뱅크) : https://namu.wiki/w/%EC%B9%B4%EC%B9%B4%EC%98%A4%EB%B1%85%ED%81%AC

- 다트(카카오 뱅크_2021.09분기 보고서) : https://dart.fss.or.kr/dsab007/main.do

 

 

부족하지만 읽어주셔서 감사합니다. 

+ Recent posts