プログラミング

Python

Python・pandasで前処理するときの色々小技まとめ

こんにちは。Pythonのpandasでデータを前処理することが最近多いのですが、そもそも本職がデータサイエンティストでもなく、しょっちゅうコードに触れていません(触れておけって感じですが)。すると、毎回のように同じところを調べて解決するの...
R

【Rでセイバーメトリクス】NPB選手の成績推移と、そこから似た選手を探していく【OPSを中心に】

はじめに こんにちは。 最近は「Rによるセイバーメトリクス入門」を使って勉強しています。 (function(b,c,f,g,a,d,e){b.MoshimoAffiliateObject=a;b=b||function(){argum...
Julia

【Python_pandas vs R_dplyr vs Julia_DataFramesMeta】3つの言語でのパイプ演算子を使ったデータ処理における対応表

はじめに こんにちは。 最近はデータサイエンス100本ノックに少しずつ取り組んでいます。このデータサイエンス100本ノックは、なんとなく名前から推測できるかもしれませんが、データサイエンスにおけるデータの加工についての演習問題が100問出さ...
Julia

【Juliaでセイバーメトリクス】2020年のパ・リーグ4強打者について比較

はじめに こんにちは。 最近はJuliaについて勉強しています。PythonやRと比較して日本語の情報は少ないように感じますが、Juliaの思想にあるようにそれぞれの言語のいいとこ取りをしているような印象があります。実際、速度も早く面白いな...
プログラミング

【ダイアグラム作成を簡単に】テキストで図を描くPlantUMLの紹介

はじめに こんにちは。 皆さんはフローチャートなどのダイアグラムを書くときにどんなツールを使っていますか? パワーポイントなどが一般的かもしれませんが、今回紹介するPlantUMLを使用すると慣れれば簡単にダイアグラムを作ることができま...
プログラミング

【Rでセイバーメトリクス】福岡ソフトバンクホークス投手陣を比較

【Rでセイバーメトリクス】福岡ソフトバンクホークス投手陣を比較 はじめに こんにちは。 最近、RStudioとtidyverseをこの本で学んでいます 。 (function(b,c,f,g,a,d,e){b.Moshimo...
プログラミング

Dockerを利用したRStudio環境を構築する【docker-composeを利用して】

はじめに こんにちは。 以前、Jupyter Notebookを利用してPythonもRもJuliaも使えるようにしたのですが、やっぱりRを使うのはRStudioがいいよなーとなってしまったので、Dockerを利用してRStudioの環境を...
プログラミング

【半自動化で機械学習】最小限のコードで可能なPyCaretを使用してみる

はじめに こんにちは。 Pythonの機械学習ライブラリと言えば、Scikit-learnやTensorFlowなどが有名です。ただ、前処理の手間であったり、複数のモデルを構築したり、それらを比較するのに時間が掛かったりします。 そこで今回...
プログラミング

【Dockerでデータサイエンス環境構築】PythonもRもJuliaもJupyterLabで使えるようにする

はじめに こんにちは! せっかくDockerを学んだので、Dockerを使ってデータサイエンス環境を構築したいと考えました。欲張りなので、JupyterLabでPythonやRやJuliaが使えるようにして、jupytextもインストール...
プログラミング

【Pythonでセイバーメトリクス】福岡ソフトバンクホークス内川聖一選手を分析するの巻

はじめに こんにちは! 今回はPythonを使う練習も兼ねて、何か実際のデータを分析したいと考えました。そこで、僕が大好きな野球選手の成績を使ってデータ分析をしてみたいと思います。 この記事は【初心者向け】33分4秒でおぼえる野球統計学と...
タイトルとURLをコピーしました