Pandasとscikit-learnで基本的なクラスタリング分析やってみた
みなさんこんにちは!今回はこちらの記事を参考にPandasの取り扱い方を勉強したので作業メモします!
記事のサンプルコードを一通り通したあとにPandasのデータフレームにして3科目の合計点をカラムに追加したところまでです。
# pandasモジュールの読み込み import pandas as pd
# pandasのオブジェクトにして結合とデータフレームの概要の確認
pd_labels = pd.DataFrame(labels)
pd_features = pd.DataFrame(features)
df.info()
temp_df.info()
# カラムの結合 df_concat = pd.concat([pd_labels, pd_features], axis=1) df_concat
# カラムのヘッダが0,1,2,3という名前になっていたので、df_concat.columnsで一気に名前変更 df_concat.columns = ['Cluster', 'Japanese', 'Math', 'English'] df_concat
# 3科目の点数の合計値を計算して追加 df_concat["sum"] = df_concat[["Japanese","Math", "English"]].sum(axis=1)
次回はこのデータを使ってグラフとか出してみるテストする予定です。
それでは!
オープンソースコミッターになったった!( ・`д・´)
ついに俺もオープンソースコミッターになったったのでご報告だぜー!ヒャッハーウオオオオアアアア( 'ω')/アアアアアッッッッ!!!!!
とあるツールのHow to useの欄にtypoがあったので報告しました。
こちらのツール、バイオインフォマティクス界隈では有名なblastnという塩基配列の相同性を見つけるソフトを高速化させることのできるツールとなっています。
typoの報告がこちら
作者氏> I have corrected the typos. Thanks for reminding!
中西、ついにやりました!!! OSSコミッターになるのが長年の目標だったのでひとまずは目標達成です〜(´ω`)
GithubでのOSS活動にはプルリクというものがあるらしいのでそちらもコードの修正とかも送れるようになるのが次の目標です。
あと流暢な英文が書けるようになるのも目標です。。。
いやー。感謝されるって気持ちのいいものですね!
pyenv globalではpython2をまず設定しましょう
こんばんは!環境構築厨の中西です←
こんな記事をみつけたのでシェア
http://qiita.com/yutaszk/items/4b9e35cd88659ba1ee88qiita.com
brew doctorでpython3のリンクが壊れてるみたいなwarningを吐かれたので調べたら上の記事がHITしました。私の環境では
pyenv global 2.7.11 3.5.1
pythonコマンドとpython2コマンドを2.7.11
python3コマンドを3.5.1に設定しました。自分の意図しないところでpythonが使われる可能性は十分にありえますので、pyenv globalは無難な設定にしておくのがいいのかなーと思いました。
OSX + pyenv + virtualenv + tensorflow で動作確認テストするまでの手順
はじめに
みなさんおはこんばんにちは(# ゚Д゚)
後輩から質問があったので、DeepLearningによく用いられるライブラリの一つであるtensorflowをセットアップして動作確認するまでの手順をまとめてみたいと思います。
今回は、OSX 10.11.6とPython 2.7.10を利用してセッティングしてみたいと思います。
homebrewのインストール
OSXのパッケージマネージャーであるhomebrewを入れます
/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
pyenvの設定
homebrewのインストールが終わったらpyenvをインストール
brew install pyenv
pyenvを利用するために以下の設定を.bash_profileに記述しておきます
export PYENV_ROOT=$HOME/.pyenv export PATH=$PYENV_ROOT/bin:$PATH eval "$(pyenv init -)"
設定の再読み込みをさせます
source ~/.bash_profile
そうするとpyenvコマンドがつかえるようになったと思いますので以下のコマンドでpython2.7.10をインストール
pyenv install 2.7.10
OSX上で使うpythonを、pyenvでインストールした2.7.10に切り替えます
pyenv global 2.7.10
virtualenvのインストール
brew install pyenv-virtualenv
virtualenvを利用するために以下の設定を.bash_profileに記述しておきます
eval "$(pyenv virtualenv-init -)"
設定の再読み込み
source ~/.bash_profile
tensorflowのインストール
virtualenv --system-site-packages ~/tensorflow
source ~/tensorflow/bin/activate
export TF_BINARY_URL=https://storage.googleapis.com/tensorflow/mac/tensorflow-0.9.0-py2-none-any.whl
pip install --upgrade $TF_BINARY_URL
ちゃんとインストールできてるか確認
$ python ... >>> import tensorflow as tf >>> hello = tf.constant('Hello, TensorFlow!') >>> sess = tf.Session() >>> print(sess.run(hello)) Hello, TensorFlow! >>> a = tf.constant(10) >>> b = tf.constant(32) >>> print(sess.run(a + b)) 42 >>>
tensorflowでの作業が終わったら以下のコマンドで仮想環境からでます
deactivate
おわりに
ざざっとやらなきゃいけないことだけを書いてきたので、分からないことがあればじゃんじゃん質問よろしくお願いします
Ubuntu16.04でGPUのハードウェア情報を知りたいとき
sudo lshw -class display
以下のページを参考にさせていただきました!
UbuntuTips/Hardware/SearchHardwareInformation - Ubuntu Japanese Wiki
git commit する前の変更を取り消す方法
こんにちは!
プログラムかいてる途中で、自分の頭のなかのロジックが間違ってることに気がついて何もかも消し去りたくなるときありますよね!
そんなときはこれ
git checkout .
ちなみに、Commitしちゃったあとの変更を取り消すにはこれ
git reset --soft HEAD^
--softを--hardにすることで、管理している実際のファイルももとの状態にロールバックされます
$ git reset --hard HEAD^
Anacondaのアップデート方法
みなさんこんにちは! 最近はAnaconda使って科学技術計算のライブラリ入れるのが楽しくてAnacondaばっかり使ってます。ライブラリのアップデートの仕方をφ(..)メモメモ!
conda update --all
この記事を参考にさせて頂きました。ありがとうございますm( )m! minus9d.hatenablog.com