静かなるブログ

音楽、Pythonなど

Python CSVの読み込みと日本語変換

日本語処理についての記事リンク

python2.xでの日本語(マルチバイト文字)問題を一掃する!(その1) — ExSoft

Python でUTF-8, shift_jis, euc_jpなど日本語を使う方法

http://www.kabipan.com/computer/python/unicode.html

 

 

 

ある統計データのCSVファイルをダウンロードしてPythonで読み込もうとしました。

単純に

import pandas as pd

df = pd.read_csv("ファイル名") 

print(df)

 

こんな感じ。

 

で帰ってきたエラーがこちら

 

Traceback (most recent call last):
File "/Users/makishi/Desktop/test_pandas.py", line 57, in <module>
t = pd.read_csv("ファイル名")
File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 465, in parser_f
return _read(filepath_or_buffer, kwds)
File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 241, in _read
parser = TextFileReader(filepath_or_buffer, **kwds)
File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 557, in __init__
self._make_engine(self.engine)
File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 694, in _make_engine
self._engine = CParserWrapper(self.f, **self.options)
File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pandas/io/parsers.py", line 1061, in __init__
self._reader = _parser.TextReader(src, **kwds)
File "pandas/parser.pyx", line 509, in pandas.parser.TextReader.__cinit__ (pandas/parser.c:4715)
File "pandas/parser.pyx", line 652, in pandas.parser.TextReader._get_header (pandas/parser.c:6441)

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x81 in position 0: invalid start byte

 

このbyte0x81はデコードできませんというのはどういうことでしょうか?

もちろん自己解決が一番ですが、わかる人がいれば教えていただけると助かります。

 

 追記: このブログでこの記事が二番目にgoogleからアクセスされるページになってます。

やはりそれほど同じエラーで困っている人が多い、ということでしょうか?

f:id:makishim1n:20151211222356p:plain

 

 

英語学習法(1) "Reading編"

自分で試してきた英語学習法をここでは紹介しようと思います。

 

----Reading編----

今回はReadingに関したものを。

まず、自分のモチベーションを保つ為に簡単なものがいいです。

僕の場合は、興味のあるタイトルのニュースをとりあえず読んでました。やり始めの頃は読んでたというか見てました。眺めてました。

NYでは地下鉄の駅構内で駅員が無料の新聞を毎朝配っています。"amNewYork" と "Metro"の二種類あったのでテキトーにどっちか取ってました。

「Let's get Metro!!! Let's get Metroooo!!!!!」って彼らが叫んでいたのを昨日のように覚えています。

語学学校にそれを持って行って休憩時間中に読んだりしてました。とりあえずわからん単語をひたすらiPhoneの辞書アプリで検索して、新聞の端っこに意味を漢字で書いていました。

そういえば、語学学校の先生が「日本人はなんでアプリを使わず電子辞書を使うんだ? そして授業中彼らは毎回それを落とすんだ。」と言っていたのを思い出しました。

 

まぁ日本にいると英語で書かれた新聞なんか出会えるはずもないので、インターネットのニュースサイトで向こうのまあ有名どころを紹介します。

ただ、興味が湧かなければこの方法は効果が薄いので、自分の興味が湧くであろう分野の記事などを英語で検索するのも一つの手でしょう。

音楽が好きなら、好きなアーティストのインタビューの記事とかそんな感じで。

Macをお使いの方は、単語を選択して右クリックすれば手軽に調べれるので活用してみてください。

わからん単語はとりあえず右クリック!!!

初めは記事のタイトルだけを眺めて内容を予測するだけでもいいかもしれませんね。

 

"Metro" 

New York – Metro

"amNewYork" 

www.amny.com

"PBS"

www.pbs.org

"NY Times"(非会員は1日5記事までの制限あり)

www.nytimes.com

"BBS News"

www.bbc.com

"CBS News"

www.cbsnews.com

"Fortune"

fortune.com

"Wired"

www.wired.com

 "NHK World"

www3.nhk.or.jp

 

初投稿

初投稿なので自己紹介など、簡単に。

 

名前:真喜志(マキシ)

年齢:1992生まれ

趣味:語学、サンプリング、温泉、ビール

現在無職で仕事を探しつつakaiMPCstudioでトラックを作っています。

また、Pythonというプログラミング言語を独学中です。

なのでこのブログではPythonと奮闘する様やトラックの紹介などがメインになると思います。

 

というわけで早速。

 

soundcloud.com