Keracon

#2. Pandas 함수 정리

현불 2019. 10. 15. 14:27

* 파일 열기

df = pd.read_csv('파일명')

 

* 특정 열의 데이터 추출

df.loc[:, 'result']: result 행의 모든 데이터 추출

df.loc[:10, 'result']: result 행의 데이터 처음부터 10번째행까지 추출

 

* 새로운 파일로 쓰기

a.to_csv('파일명', index=False)

 

* 새롭게 파일 만들기

file=open("만들파일명", 'w', newline='', encoding='utf-8-sig')

wr = csv.writer(file)
header = ["ID", "번역"]
wr.writerow(header) # 행 작성하기


for i in range(count):
    text = df['Image_Content_txt_result'][i]
    translated = str(translate_text(text))
    list = [i, translated]
    print(translated)
    wr.writerow(list)

 

file.close()

 

* 열 비교해서 새로운 파일로 만들기

a = pd.read_csv("파일1")

b = pd.read_csv("파일2")


a.rename(columns={'Unnamed: 0':'ID'}, inplace = True) #서로 열 이름 맞춰주기
b.rename(columns={'번': 'ID'}, inplace=True)


merged = a.merge(b, on='ID') #'ID' 열 값 비교해서 합쳐주기

merged.to_csv("/Users/hbae/PycharmProjects/keraconocr/venv/output.csv", index=False)