IT系バンドマンの日常

備忘録やライフログなど

Pandasとscikit-learnで基本的なクラスタリング分析やってみた

みなさんこんにちは!今回はこちらの記事を参考にPandasの取り扱い方を勉強したので作業メモします!

qiita.com

記事のサンプルコードを一通り通したあとにPandasのデータフレームにして3科目の合計点をカラムに追加したところまでです。

# pandasモジュールの読み込み
import pandas as pd
# pandasのオブジェクトにして結合とデータフレームの概要の確認
pd_labels = pd.DataFrame(labels)
pd_features = pd.DataFrame(features)
df.info()
temp_df.info()
# カラムの結合
df_concat = pd.concat([pd_labels, pd_features], axis=1)
df_concat
# カラムのヘッダが0,1,2,3という名前になっていたので、df_concat.columnsで一気に名前変更
df_concat.columns = ['Cluster', 'Japanese', 'Math', 'English']
df_concat
# 3科目の点数の合計値を計算して追加
df_concat["sum"] = df_concat[["Japanese","Math", "English"]].sum(axis=1)

次回はこのデータを使ってグラフとか出してみるテストする予定です。

それでは!

オープンソースコミッターになったった!( ・`д・´)

ついに俺もオープンソースコミッターになったったのでご報告だぜー!ヒャッハーウオオオオアアアア( 'ω')/アアアアアッッッッ!!!!!

とあるツールのHow to useの欄にtypoがあったので報告しました。

github.com

こちらのツール、バイオインフォマティクス界隈では有名なblastnという塩基配列の相同性を見つけるソフトを高速化させることのできるツールとなっています。

typoの報告がこちら

github.com

作者氏> I have corrected the typos. Thanks for reminding!

中西、ついにやりました!!! OSSコミッターになるのが長年の目標だったのでひとまずは目標達成です〜(´ω`)

GithubでのOSS活動にはプルリクというものがあるらしいのでそちらもコードの修正とかも送れるようになるのが次の目標です。

あと流暢な英文が書けるようになるのも目標です。。。

いやー。感謝されるって気持ちのいいものですね!

これからもいつもお世話になってるOSSに還元できるようにOSS活動頑張って行きたいと思います。

pyenv globalではpython2をまず設定しましょう

こんばんは!環境構築厨の中西です←

こんな記事をみつけたのでシェア

http://qiita.com/yutaszk/items/4b9e35cd88659ba1ee88qiita.com

brew doctorでpython3のリンクが壊れてるみたいなwarningを吐かれたので調べたら上の記事がHITしました。私の環境では

pyenv global 2.7.11 3.5.1

pythonコマンドとpython2コマンドを2.7.11

python3コマンドを3.5.1に設定しました。自分の意図しないところでpythonが使われる可能性は十分にありえますので、pyenv globalは無難な設定にしておくのがいいのかなーと思いました。

OSX + pyenv + virtualenv + tensorflow で動作確認テストするまでの手順

はじめに

みなさんおはこんばんにちは(# ゚Д゚)

後輩から質問があったので、DeepLearningによく用いられるライブラリの一つであるtensorflowをセットアップして動作確認するまでの手順をまとめてみたいと思います。

今回は、OSX 10.11.6とPython 2.7.10を利用してセッティングしてみたいと思います。

homebrewのインストール

OSXのパッケージマネージャーであるhomebrewを入れます

/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"

pyenvの設定

homebrewのインストールが終わったらpyenvをインストール

brew install pyenv

pyenvを利用するために以下の設定を.bash_profileに記述しておきます

export PYENV_ROOT=$HOME/.pyenv
export PATH=$PYENV_ROOT/bin:$PATH
eval "$(pyenv init -)"

設定の再読み込みをさせます

source ~/.bash_profile

そうするとpyenvコマンドがつかえるようになったと思いますので以下のコマンドでpython2.7.10をインストール

pyenv install 2.7.10

OSX上で使うpythonを、pyenvでインストールした2.7.10に切り替えます

pyenv global 2.7.10

virtualenvのインストール

brew install pyenv-virtualenv

virtualenvを利用するために以下の設定を.bash_profileに記述しておきます

eval "$(pyenv virtualenv-init -)"

設定の再読み込み

source ~/.bash_profile

tensorflowのインストール

virtualenv --system-site-packages ~/tensorflow
source ~/tensorflow/bin/activate
export TF_BINARY_URL=https://storage.googleapis.com/tensorflow/mac/tensorflow-0.9.0-py2-none-any.whl
pip install --upgrade $TF_BINARY_URL

ちゃんとインストールできてるか確認

$ python
...
>>> import tensorflow as tf
>>> hello = tf.constant('Hello, TensorFlow!')
>>> sess = tf.Session()
>>> print(sess.run(hello))
Hello, TensorFlow!
>>> a = tf.constant(10)
>>> b = tf.constant(32)
>>> print(sess.run(a + b))
42
>>>

tensorflowでの作業が終わったら以下のコマンドで仮想環境からでます

deactivate

おわりに

ざざっとやらなきゃいけないことだけを書いてきたので、分からないことがあればじゃんじゃん質問よろしくお願いします

git commit する前の変更を取り消す方法

こんにちは!

プログラムかいてる途中で、自分の頭のなかのロジックが間違ってることに気がついて何もかも消し去りたくなるときありますよね!

そんなときはこれ

git checkout .

ちなみに、Commitしちゃったあとの変更を取り消すにはこれ

git reset --soft HEAD^

--softを--hardにすることで、管理している実際のファイルももとの状態にロールバックされます

$ git reset --hard HEAD^

Anacondaのアップデート方法

みなさんこんにちは! 最近はAnaconda使って科学技術計算のライブラリ入れるのが楽しくてAnacondaばっかり使ってます。ライブラリのアップデートの仕方をφ(..)メモメモ!

conda update --all

この記事を参考にさせて頂きました。ありがとうございますm( )m! minus9d.hatenablog.com