defbags(): pages = 10 title = [] price = [] sex = [] img = [] dfs = [] for page in range(1, pages+1): url = "https://www.gucci.com/kr/ko/c/productgrid?categoryCode=men-bags&show=Page&page={}".format(page) response = requests.get(url) print("여자 가방 {}페이지 크롤링 중 입니다...".format(page)) a = response.json()['products'] b = a['items'] for idx in range(len(b)): title.append(b[idx]['title']) price.append(b[idx]['price']) img.append(b[idx]['primaryImage']['src'][2:]) sex.append('Men') for page in range(1, pages+1): url = "https://www.gucci.com/kr/ko/c/productgrid?categoryCode=women-handbags&show=Page&page={}".format(page) response = requests.get(url) print("남자 가방 {}페이지 크롤링 중 입니다...".format(page)) a = response.json()['products'] b = a['items'] for idx in range(len(b)): title.append(b[idx]['title']) price.append(b[idx]['price']) img.append(b[idx]['primaryImage']['src'][2:]) sex.append('Women') title_df = pd.DataFrame(title) price_df = pd.DataFrame(price) img_df = pd.DataFrame(img) sex_df = pd.DataFrame(sex) dfs.append(title_df) dfs.append(price_df) dfs.append(img_df) dfs.append(sex_df) gucci_bags_df = pd.concat(dfs, axis=1) gucci_bags_df.reset_index(drop=True, inplace=True) gucci_bags_df['brand'] = 'GUCCI' gucci_bags_df.columns = ['title', 'price', 'image', 'sex', 'brand'] gucci_bags_df = gucci_bags_df[['brand', 'title', 'price', 'sex', 'image']] a = list(gucci_bags_df['price']) ls = [] for x in a: num = re.findall("\d+", x) num = "".join(num) num = int(num) ls.append(num) gucci_bags_df['price'] = ls gucci_bags_df.to_csv("gucci_bags.csv", index=False, encoding="utf-8") print("사진 저장을 시작합니다") for idx, link in enumerate(img): url = "http://" + link urllib.request.urlretrieve(url, 'bags/' + 'g' + str(idx) + '.jpg') return gucci_bags_df
1 2 3
# 코드 실행 import urllib.request bags()
여자 가방 1페이지 크롤링 중 입니다...
여자 가방 2페이지 크롤링 중 입니다...
여자 가방 3페이지 크롤링 중 입니다...
여자 가방 4페이지 크롤링 중 입니다...
여자 가방 5페이지 크롤링 중 입니다...
여자 가방 6페이지 크롤링 중 입니다...
여자 가방 7페이지 크롤링 중 입니다...
여자 가방 8페이지 크롤링 중 입니다...
여자 가방 9페이지 크롤링 중 입니다...
여자 가방 10페이지 크롤링 중 입니다...
남자 가방 1페이지 크롤링 중 입니다...
남자 가방 2페이지 크롤링 중 입니다...
남자 가방 3페이지 크롤링 중 입니다...
남자 가방 4페이지 크롤링 중 입니다...
남자 가방 5페이지 크롤링 중 입니다...
남자 가방 6페이지 크롤링 중 입니다...
남자 가방 7페이지 크롤링 중 입니다...
남자 가방 8페이지 크롤링 중 입니다...
남자 가방 9페이지 크롤링 중 입니다...
남자 가방 10페이지 크롤링 중 입니다...
사진 저장을 시작합니다
defplotImages(n): fig, ax = plt.subplots(1,4, figsize=(15, 5)) for i in range(4): ax[i].imshow(selectImage(n, i, dists, images)) ax[i].set_xticks([]) ax[i].set_yticks([]) plt.show()
grey로 바꾼 후의 비슷한 가방 모양 찾기
1
plotImages(80)
색을 그대로 두면 어떨까?
1 2 3 4 5
features_c = []
for im in images: im = mh.imread(im) features_c.append(mh.features.haralick(im).ravel())
1 2 3 4 5 6 7
from scipy.spatial import distance from sklearn.preprocessing import StandardScaler
defplotImages_c(n): fig, ax = plt.subplots(1,4, figsize=(15, 5)) for i in range(4): ax[i].imshow(selectImage_c(n, i, dists, images)) ax[i].set_xticks([]) ax[i].set_yticks([]) plt.show()