공부/A.I

forge데이터셋

래울 2021. 5. 9. 16:52

books.google.co.kr/books?id=tPaTDwAAQBAJ&lpg=PP1&dq=%ED%8C%8C%EC%9D%B4%EC%8D%AC%EB%9D%BC%EC%9D%B4%EB%B8%8C%EB%9F%AC%EB%A6%AC%EB%A5%BC%20%ED%99%9C%EC%9A%A9%ED%95%9C%20%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D&hl=ko&pg=PA1#v=onepage&q=%ED%8C%8C%EC%9D%B4%EC%8D%AC%EB%9D%BC%EC%9D%B4%EB%B8%8C%EB%9F%AC%EB%A6%AC%EB%A5%BC%20%ED%99%9C%EC%9A%A9%ED%95%9C%20%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D&f=false

 

파이썬 라이브러리를 활용한 머신러닝(번역개정판)

사이킷런 핵심 개발자에게 배우는 머신러닝 이론과 구현   현업에서 머신러닝을 연구하고 인공지능 서비스를 개발하기 위해 꼭 학위를 받을 필요는 없습니다. 사이킷런(scikit-learn)과 같은 훌륭

books.google.co.jp

 

- forge데이터 셋

두 개의 특성을 가진 forge 데이터 셋

두개의 특성에 대해 산점도 그리기

...(warnings.warn은 업데이트가 필요하다는 경고 메시지라한다.)

 

 

 

- k-최근접 이웃 분류

k-NN알고리즘, k가 1일때와 3일때

 

 

 

- forge데이터 셋에 대한 k-NN알고리즘 적용

 

 

 

 

- 결정경계

k-NN알고리즘에서 이웃의 개수를 1개, 3개, 9개에 따른 결정경계를 나타낸 것이다.

이웃을 적게 선택할 수록 경계가 훈련데이터에 가깝게 붙어있고 이웃을 늘릴 수록 경계가 더 부드러워 진다.

 

이웃을 적게 사용 → 모델의 복잡도가 높음 → 일반화▽

이웃을 많이 사용 → 모델의 복잡도가 낮아짐 → 일반화▲

 

내일은 유방암 데이터셋으로 일반화와 복잡도 관계에 대해..