지금 허깅페이스로 영화 리뷰 텍스트 감성 분류하기 실습을 하고있습니다.
네이버 영화 리뷰 데이터 가져오려고 했는데 다음과 같이 가져올수 없다고 해요
어떤 분은 이미 책처럼 하셨던데 저는 왜 안되는건지…
일단 지피티 도움 받아서
import pandas as pd
train_df = pd.read_table("https://raw.githubusercontent.com/e9t/nsmc/master/ratings_train.txt")
test_df = pd.read_table("https://raw.githubusercontent.com/e9t/nsmc/master/ratings_test.txt")
from datasets import Dataset, DatasetDict
# 변환
train_dataset = Dataset.from_pandas(train_df)
test_dataset = Dataset.from_pandas(test_df)
# 딕셔너리처럼 묶기
nsmc = DatasetDict({
'train': train_dataset,
'test': test_dataset
})
이렇게 변환하긴 했거든요? 이렇게 사용해도 되는건가요??
