빅파이2 Decision Tree2 실습( Mushroom 데이터) 0. 필요한 기능 import 1. 데이터 불러오기 2. 전체 행/여려 수 확인 3. 결측치 확인 - 결측치는 없다. 4. 문제/답 나누기 - loc 사용하여 컬럼명으로 문제와 답 나눠줌 - 전체 23개 컬럼 중 22개가 문제로 들어갔고 1개가 답으로 들어간 걸 확인할 수 있다! 5. 기술통계 6. 라벨의 분포 - describe() : 기술통계 확인하는 함수 - 답이(y) 고르게 분포되어있는지 확인 => 고르게 분포해야 잘 예측할 수 있음 - value_counts() : 시리즈의 라벨 개수 확인하는 함수 - 글자데이터는 학습시킬 수 X - 숫자데이터로 인코딩(라벨/원핫) 필요!! - 순서X 범주형: 혈액형, 성별 - 순서O 범주형: 성적(학점), 설문조사 선택지(좋음, 보통, 나쁘다) 라벨인코딩 : .. 2020. 7. 14. 유튜브 크롤링하기(제목, 주소, 조회수) from selenium import webdriver from bs4 import BeautifulSoup as bs import pandas as pd from selenium.webdriver.common.keys import Keys import time keyword = '오마이걸' url = 'https://www.youtube.com/results?search_query={}'.format(keyword) driver = webdriver.Chrome('./chromedriver.exe') driver.get(url) soup = bs(driver.page_source, 'html.parser') driver.close() name = soup.select('a#video-title') vi.. 2020. 6. 1. 이전 1 다음 728x90 반응형