ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • #2. Pandas 함수 정리
    Keracon 2019. 10. 15. 14:27

    * 파일 열기

    df = pd.read_csv('파일명')

     

    * 특정 열의 데이터 추출

    df.loc[:, 'result']: result 행의 모든 데이터 추출

    df.loc[:10, 'result']: result 행의 데이터 처음부터 10번째행까지 추출

     

    * 새로운 파일로 쓰기

    a.to_csv('파일명', index=False)

     

    * 새롭게 파일 만들기

    file=open("만들파일명", 'w', newline='', encoding='utf-8-sig')

    wr = csv.writer(file)
    header = ["ID", "번역"]
    wr.writerow(header) # 행 작성하기


    for i in range(count):
        text = df['Image_Content_txt_result'][i]
        translated = str(translate_text(text))
        list = [i, translated]
        print(translated)
        wr.writerow(list)

     

    file.close()

     

    * 열 비교해서 새로운 파일로 만들기

    a = pd.read_csv("파일1")

    b = pd.read_csv("파일2")


    a.rename(columns={'Unnamed: 0':'ID'}, inplace = True) #서로 열 이름 맞춰주기
    b.rename(columns={'번': 'ID'}, inplace=True)


    merged = a.merge(b, on='ID') #'ID' 열 값 비교해서 합쳐주기

    merged.to_csv("/Users/hbae/PycharmProjects/keraconocr/venv/output.csv", index=False)

    'Keracon' 카테고리의 다른 글

    #1. git fork & rebase  (0) 2019.09.28

    댓글

©hyunbul