活動記録
第18回 ビギナーチーム会
2021-09-28(18時10分~19時00分)
夏休みやったこと
@佐藤駿
- 8 月中はコーディングがメイン
- DS 倶楽部もいろいろやった
- 9 月は PE に向けて英語の勉強
- TOEIC 750 取得 🎉🎉🎉
- 倫理学とか政治学とかの本を読んでいる
- 最近読んだのは「繋がりすぎた世界の先へ」
- コロナの話から導入
- ポストコロナでの経済の話
- インタービューの字起こしでまとめられた本
- 最近読んだのは「繋がりすぎた世界の先へ」
- 4 年生を卒業した後について考えた
- 就職 or 院進(横国目指すかも?)
- 3 年生でインターンとか経験したい
@吾郷廉
- 統計検定の勉強を頑張った
- ただ、申し込みをまだしていない
- 今年の 12 月までには統計検定の2級を受けてくる!
- R で学ぶ統計学を買ったが、まだ手をつけていないのでこれから手をつつける
- ワクチン打つか打たないか
- いろいろなワクチンに関する本を読んだ
- 集団免疫に関する話
- 集団免疫が 80%に達しないと意味がないと思って、打つことを決めました
- いろいろなワクチンに関する本を読んだ
- 20 歳になったので、飲み会に参加しました
@諸田 健太朗
- 7 月の中旬くらいに体調が崩れてきた
- 8 月の前半まで調子が出ない日が続いた
- 8 月の半ばくらいに実家に帰った
- その後横浜に戻ってきて、NEC のコンペが 9 月 10 日まで頑張った
- 結果はまだ出ていないが、かなり難しかったそう
- そのあとは Kaggle をガチりたい
- Kaggle 日記を続けている
- メダル獲得を目指している
@浦 優太
- インターンに行ってきました
- 3 年になったら、PBL に行ってくることになると思うが、それではなく普通の選考をしていくやつ
- インターン先は Visional(ビズリーチ) ってとこ
- Web エンジニアとしてインターン参加
- 8/2 ~ 9/17 約 40 日間、9 時〜18 時までフルコミットしました
- サーバーサイド開発とか、フロントエンド開発をやってまして
- なんと、お給料が出る
- 参加の経緯
- https://athletix.run/contents に登録していた
- 逆求人イベント
- 学生と企業の比率が 1:1 くらい企業が学生のことを知りたがく
- そこで ビズリーチ と出会った
- ただ、アピールできるものがないと厳しい
- なので、今から何かしてみるといいと思う
- 浜大際のオンライン開催に向けて、実行委員と連携してサイト開発などを計画していた
- 富士フイルムの画像コンペがあって、それに参加していた
- 上位には入れなかったが、頑張ってで賞
- チェキをいただきました
第17回 ビギナーチーム会
2021-07-11(22時00分~23時00分)
やったこと
@吾郷廉
ゲーム開発をやってみている。ライブラリには
python
のtkinter
を利用している。@松丸 豪志
クラフトビールの Web 版をアプリでリリースしました!
https://apps.apple.com/jp/app/%E3%83%93%E3%82%A2%E3%82%B3%E3%83%AC/id1575319496
@佐藤駿
統計検定の2級を受けている。Python と R、HTML をやっている。外部で進学する予定なので微積・線形代数を勉強している。
@諸田 健太朗
佐藤先生のバイトは地道にやっている。DS クラブで SIGNATE の練習問題をやったり。
@河原富士晴
Engine を辞めます。他のサークル・バイトとかに時間を使っていきます!
その他
テスト期間なので、来週はおやすみです!
第16回 ビギナーチーム会
2021-06-18(22時00分~23時00分)
やったこと
@佐藤駿
HTML を勉強中。 データ分析(民泊サービス)
@諸田 健太朗
佐藤先生のバイトで JavaScript でブロック崩し、タイピングゲームを作成。 データ分析(民泊サービス)
@松丸 豪志
クラフトビールのウェブアプリの開発の報告 https://craftbeer-collection.com/
@河原富士晴
本を読んで、jQuery に取り組んでいる。
第15回 ビギナーチーム会
2021-05-29(10時00分~11時00分)
やったこと
@佐藤駿
SIGNATE コンペの分析過程の説明
@諸田 健太朗
SIGNATE コンペの分析過程の説明、概要
@松丸 豪志
クラフトビールのウェブアプリの開発の報告
第18回 データ分析MTG
2021-05-23(20時00分~20時30分)
やったこと
@室井 葉介
リーダーボードで公開されている一番いいスコアのノートブックを参考に、 数値を変えながら色々試してみた。
@浦 優太
Min-Hash などの方法を使って分析が出来ないが色々試してみるいるが、うまくいかないのでこの方法は諦めた。
@室井 葉介君がやっているように Bert 等を使ってやっていく
第17回 データ分析MTG
2021-05-16(11時00分~11時40分)
やったこと
@室井 葉介
Bert を使った公開されているノートブックを参考に分析をして、ハイパーパラメーターの調整を行った。 Bert についての基礎的な調査を行った。
次回までやること
次回は 5 月 23 日の午前中の予定
第16回 データ分析MTG
2021-05-08(20時00分~21時25分)
やったこと
@室井 葉介
Bert を使った公開されているノートブックを参考に分析をしてみた。
@浦 優太
ビッグデータ解析で学んだ文書分類の方法で分析をしてみました。 F ベータ値を考慮していない評価関数だったので、そこを修正する。 大きなデータの時処理しきれない問題が発生しているので、それを修正する。
@高森 皓太郎
ラベルが文字列に含まれているかどうかで予測をしてみる。次回は bert とか使って分析していく。
@諸田 健太朗 と @佐藤駿
Signate のコンペに取り組んでいます。提出がまだなので、次回以降に詳しく共有してもらいます。
次回までやること
次回は 4 月 18 日の午前中の予定
第12回 ビギナーチーム会
2021-05-02(22時00分~22時30分)
やったこと
@吾郷廉
Python でゲームを作る本を読んで勉強し始めた
@佐藤駿
SIGNATE と統計検定 2 級勉強した。
@諸田 健太朗
Kaggle の本を読んだ。
@河原富士晴
Django の本で勉強をした。
浜大祭アプリ開発MTG
2021-05-01(22時00分~22時50分)
やったこと
近況報告
- 管理ページの進捗を共有
- 一般の方はまだ準備ができていないことを説明
お金のこと
- 想定で 3 万円・Max で 5 万円程かかる見込みなので、それを会計に取り合っていただけるとのこと
〈HP 企画ごと要望〉
- ミスミス → 候補者が載るサイト
- 企画ページに候補者一覧を載せれるようにして行けたらいい。
- フリマ → 出展者応募リンク
- 出展団体として機能させるか、申請リンクをどこかに載せるか
- フード → 投票機能
- 投票機能・詳しい機能は担当の人につないでもらう。
- 後夜祭 → くじ引き機能(?)
- 詳しい話は担当者につないでもらう。
その他
- 企業広告はヘッダーではなくても、コンテンツの中に埋め込む形でも問題なさそう。
- トップページに Twitter なり Instagram なりのフィードを載せられたらいいかも!
- LP は早めに取り掛かりたい
第11回 ビギナーチーム会
2021-04-25(22時00分~23時00分)
やったこと
@吾郷廉
Python でゲームを作る本を読んで勉強し始めた
@佐藤駿
横浜市をよくしていくという目的でオープンデータを利用して分析をしてみた
@松丸 豪志
Google Map API を使って、Flutter に地図を表示した
@諸田 健太朗
Youtube の動画を見つけて、機械学習の勉強をしている
@河原富士晴
Django の本を買って勉強を始めました
共有事項
- @河原富士晴 が自分の話をしてくれました
第15回 データ分析MTG
2021-04-25(21時00分~22時00分)
やったこと
@小林 義幸
sklearn を使ったコサイン類似度を計算するのがうまくいかなかったので、 gensim ライブラリを利用してコサイン類似度を求めてみた
@室井 葉介
前処理をもう少し詳しくやってみた。
@浦 優太
td-idf 値を計算して、コサイン類似度を使って分類した。 ノイズとなっていそうな単語多く、スコアは悪かった。
次回までやること
次回は 4 月 18 日の午前中の予定
第14回 データ分析MTG
2021-04-19(21時00分~22時00分)
やったこと
@小林 義幸
単純にラベルがテキストに含まれているかどうかで分類した
@室井 葉介
stemmer で語幹を揃えて、前回と同じように分析したが、結果は変わらなかった
@浦 優太
単語の出現頻度が高いモノ同士を比較して、出現頻度が高い単語が似ていればラベルつけするという処理
次回までやること
第10回 ビギナーチーム会
2021-04-18(23時00分~23時35分)
やったこと
@吾郷廉
@佐藤駿
@松丸 豪志
クラフトビールのレビューができるようなアプリを絶賛開発中
@諸田 健太朗
@佐藤駿と一緒にいろいろ活動中
共有事項
- 佐藤先生とメッシュ統計に関することでアルバイトの募集を呼びかけました。
アプリリリース話共有会
2021-04-14(17時00分~18時00分)
@松丸 豪志がFlutterでアプリをリリースしたのでそれについて共有会をしています。
プログラミング初心者が独学でアプリをリリースするまでの道のり
第13回 データ分析MTG
2021-04-11(10時00分~11時00分)
やったこと
@小林 義幸
単語の出現頻度を数えたり、N-gram での出現頻度を可視化したりした。
@室井 葉介
他の人の EDA などを参考にして理解を深めた。一応提出までできた
@浦 優太
他の人の EDA などを参考にして理解を深めた。一応提出までできた
次回までやること
次回は 4 月 18 日の午前中の予定
第9回 ビギナーチーム会
2021-04-09(21時00分~21時30分)
やったこと
今週は人が人が集まらなかったのでパス
第12回 データ分析MTG
2021-04-05(20時00分~20時45分)
やったこと
@小林 義幸
説明文を読んだり、データの読み込みなどをローカルの Jupyter などで実験したりした。
@室井 葉介
他の人の EDA などを参考にして理解を深めた
@浦 優太
Kaggle の説明文などをもろもろ日本語に直して評価方法などについて理解を深めた
次回までやること
次回は 4 月 11 日の午前中の予定
第11回 データ分析MTG
2021-03-29(11時00分~12時30分)
やったこと
@小林 義幸
自然言語処理のツールの一部である
Stemmers
というモジュールを使用してロジスティック回帰分析で分析・予測を行った。 BERT で深層学習するのと同じくらいのスコアがでた@室井 葉介
深層学習のパラメータチューニングをしつつ、学習を行ったが、Colab 上ではエラーが発生してうまく動作しない箇所もあった。
@浦 優太
BERT と PyTorch を使って深層学習で学習・予測を行った。
次回までやること
次回は 4 月5日の午前中 それ以降月曜4限の時間で活動する予定
次回からはColeridge Initiative - Show US the Dataを行う
第8回 ビギナーチーム会
2021-03-27(22時00分~23時00分)
やったこと
今週勉強したことについて報告
@河原富士晴
@佐藤駿
趣味や横市を志望する理由などを話してもらいました。
第7回 ビギナーチーム会
2021-03-21(22時00分~23時00分)
やったこと
今週勉強したことについて報告
@諸田 健太朗
@河原富士晴
@佐藤駿
ボストン住宅価格データセットを使って MLP の使い方を学びました
@松丸 豪志
バックグラウンドや Flutter を触るきっかけなどを話してもらいました。
第10回 データ分析MTG
2021-03-20(11時00分~12時20分)
やったこと
@小林 義幸
ツイートの前処理(URL や
#
,@
の削除)をしたのち、サブミッションをしたが、スコアは前回から少し低くなる結果となった。@室井 葉介
EDA や WordCloud での可視化して、BERT を使って分類した。
@浦 優太
EDA 多めでツイートと target との関係を深く探っていった。
次回までやること
次回は 3 月 29 日の 午前中
第6回 ビギナーチーム会②
2021-03-15(22時00分~22時18分)
やったこと
今週勉強したことについて報告
@佐藤駿
iris データを使ってロジスティック回帰と主成分分析について学びました。
@松丸 豪志
FFmpeg を使って、Flutter で動画を画像に変換してみた
@河原富士晴
@吾郷廉
今後の方針について
個人での勉強報告が活動になっていますが、もう少しサークルだからこそなことをできたらいいなと思います!
来週からは順番にプログラミングのこと・自分自身のことなどを少し話をして親睦を深めましょう!
次回までにやること
- 余裕がある人は、何かしらを勉強したものを Issue として投稿する
- @松丸 豪志 は自分の話をする準備をお願いします!
第6回 ビギナーチーム会①
2021-03-15(10時00分~10時30分)
やったこと
今週勉強したことについて報告
@諸田 健太朗
第9回 データ分析MTG
2021-03-13(10時00分~11時00分)
やったこと
@小林 義幸
BERT で分析を行った。参考
@室井 葉介
前処理を行ったがいくつか欠陥が見られた(I'm→Im になってしまうなど)。EDA を行ったのちリッジ回帰で分析した。
@浦 優太
テキストとターゲットの関係を確認。ターゲットが 0 のものを見る。グーグルで音楽とかスポーツとかのものを request を使ってやろうと思ったが失敗した。
次回までやること
次回は 3 月 20 日の 午前中
第5回 ビギナーチーム会
2021-03-08(22時00分~22時11分)
やったこと
今週勉強したことについて報告
@河原富士晴
@佐藤駿
@松丸 豪志
Flutter で Firebase を使うための準備を行なった
@諸田 健太朗
@吾郷廉
今後の方針について
ビギナーチームが始まってから約1ヶ月間それぞれで勉強をしてもらいました。
プログラミングを始める第一歩は既に超えられたと思うので、勉強の報告は任意でやっていくことにします。
もちろんアウトプットを出すことはとても良いことだし、自分だけじゃなくて周りにも刺激を与えることなので余裕がある人は継続してもらえればなと思います。
次回までにやること
- 余裕がある人は、何かしらを勉強したものを Issue として投稿する
第8回 データ分析MTG
2021-03-05(20時00分~20時40分)
やったこと
@小林 義幸
LSTM で分析した
@室井 葉介
自然言語処理の入門をやった
@浦 優太
統計でできる範囲で分析をした
次回までやること
次回は 3 月 13 日の 11 時〜
1年生の方針決め
2021-03-04(16時00分~16時45分)
一年生のやりたいイメージ
- 実務的なやってみたい(実際のデータを扱ってみたい)
- (将来的には)Kaggle のコンペに参加してみたい
興味がある範囲
@佐藤駿
- 機械学習
@諸田 健太朗
- 機械学習
- DeepLearing
レベル感
統計の数理メイン
重回帰分析はまだ学校ではそれほど習っていない。
今後の活動内容
- 毎週、機械学習の勉強をしてフィードバックをもらう
- 3 年生の活動を見学する
第4回 ビギナーチーム会
2021-03-01(10時00分~10時30分)
やったこと
今週勉強したことについて報告
@佐藤駿
100 問ノックと DeepLearing について学び始めました。
@吾郷廉
@河原富士晴
@諸田 健太朗
@松丸 豪志
Flutter の CustomPaint を使って、骨格と角度の表示を行った。
次回までにやること
- 何かしらを勉強したものを Issue として投稿する
- データ分析をしていきたい人は Slack の
#kaggle
チャンネルでコメントを残す
第7回 データ分析MTG
2021-02-26(16時00分~16時15分)
やったこと
次回からは Natural Language Processing with Disaster Tweets に挑戦
次回までやること
難易度が前回より上がっているので特に目安は設けないが記事などを参考に各々まず 1 回やってみる。
第6回 データ分析MTG
2021-02-19(20時30分~21時30分)
やったこと
@室井 葉介
説明変数を標準化し、目的変数を対数変換した。
@小林 義幸
前回の浦のモデルから改良し、線形回帰だけでなくリッジ回帰とラッソ回帰でも試した。
@諸田 健太朗
次回から活動に参加。解析せずともとりあえずメンバーの分析を見てみる。
@根本 貴志
アプリチームの紹介。
次回までやること
次回から挑戦するコンペについて Slack にて話し合い、決める。
第3回 ビギナーチーム会
2021-02-19(10時00分~10時30分)
やったこと
今週勉強したことについて報告
次回までにやること
- 何かしらを勉強したものを Issue として投稿する
第5回 データ分析MTG
2021-02-12(15時00分~16時30分)
やったこと
@室井 葉介
ダミー変数化したのちに、重回帰分析をした。
@浦 優太
日本語のチュートリアルをみながら初提出までやってみた
@小林 義幸
PyTorch を使って深層学習で予測してみた。
次回までやること
一旦 Houce Price を続きでやっていって、次のコンペをどうするかなんとなく考えておく。
第2回 ビギナーチーム会
2021-02-12(10時00分~10時30分)
やったこと
今週勉強したことについて報告
次回までにやること
- 何かしらを勉強したものを Issue として投稿する
第1回 app-dev会議
2021-02-10(22時00分~22時30分)
やったこと
オリエンテーション
- 今後の活動方針
のについての話し合い
とりあえず楽しくやりましょう!
第1回 ビギナーチーム会
2021-02-08(10時00分~10時40分)
やったこと
今週勉強したことについて報告
- @吾郷廉
は先週のオリエンテーションに不参加だったためオリエンテーションを実施
次回までにやること
- 何かしらを勉強したものを Issue として投稿する
第4回 データ分析MTG
2021-02-05(17時00分~19時00分)
やったこと
Kaggle のソースコードを git で管理するために
- pyenv
- pipenv
のインストールをしてもらった
- @小林 義幸
重回帰分析をしてみたが、予測値が 0 や無限になってしまったものがあった。次回までに修正してくる
第3回 データ分析MTG
2021-01-29(17時00分~18時00分)
やったこと
- 欠損値についての確認
- Null の値が「プールがない」のように不明というわけではないものがあった
- 年代のデータを経済状況と合わせて考えると有用なデータになりそう。
次回までにやること
- Github のレポジトリを作成してソースコードの共有をする
- 欠損値についての確認
YCUスケジュールの運用について
2021-01-29(14時00分~14時24分)
背景
学生担当嶋崎さんと ICT 推進室の関さんを交えて YCU スケジュールを 2021 年度正式に運用していくにはという話し合いをした。
話合い録
二次利用の利用について規定されている。学内の公式ではない場所に転載されてしまうことが二次利用にあたる。
顧問の先生も交えてやらないと無理かもしれない。
責任の所在を明らかにしたい。
今後は顧問の先生と教務の方とで話を進めていく必要がある。
現在の課題
- 個人情報の保護について
- 責任の所在について
- 継続性や保守性などについて
第3回 オリエンテーション
2021-01-29(10時00分~12時20分)
やったこと
- Engine についての説明
- Github と git のチュートリアルを実施
- 初心者ロードマップの説明
次回までにやること
- 何かしらを勉強したものを Issue として投稿する
感じた課題
第2回 オリエンテーション
2021-01-28(19時00分~21時00分)
やったこと
- Engine についての説明
- Github と git のチュートリアルを実施
次回までにやること
- なし
感じた課題
- Windows ユーザーの場合少し不都合を感じた。
- 一年生に対して同じことができるか不安である。
第1回 オリエンテーション
2021-01-28(13時00分~14時30分)
やったこと
- Engine についての説明
- Github と git のチュートリアルを実施
次回までにやること
- なし
感じた課題
- Windows ユーザーの場合少し不都合を感じた。
- 一年生に対して同じことができるか不安である。
第2回 データ分析MTG
2021-01-22(17時00分~18時55分)
今後の活動の仕方について
- 参加メンバーを確定する
- ハウスプライスは各々で完成形を持ち寄る。
- 着目点とかを共有する
ハウスプライス終わった後
ちゃんとメダル取れるようにする。
チーム作ってコミットしたりする。
進め方
- @小林 義幸 が引っ張って終わらせる。
- 週に 1 回集まりその週でやったことを報告する。
- 2 月中に終わらせる
雑談
院進について雑談しました
第1回 データ分析MTG
2021-01-15(17時00分~18時30分)
参加コンペ
@DataAnalitics として初めて取り組むコンペは House Prices という住宅の価格を予測するコンペティションです。
このコンペは Kaggle の練習問題の 1 つで、メダルや賞金などは発生しません。ただ、日本語の情報なども多く、最初にやるコンペとしては最適だと思いました。
活動内容
課題の概要を一緒に確認したり、評価方法・データのカラムについて確認しました。
その後、Exploratoryという R ベースの統計ソフトウェアを用いて細かいデータについて確認しました。また、今回のデータセットはカラム数が多く、不要だと思われるものも多数あったので、どういった変数が不要かということを調べるために、欠損値が多いカラム・値の偏りが大きいカラムについて洗い出しました。また、次回までの課題として洗い出したカラムが住宅価格と相関関係にあるかどうかを調べます。
第0回 Engine会議録
2021-01-12(19時00分~21時00分)
活動内容について
Engine は @DataAnalitics と @WebDev を当面の主な活動としていくこととする。
データ分析チームは Kaggle でのコンペ参加を主な活動とし、チームメンバー全員が
Kaggle Expert
になることを目標とする。@WebDev は ycu-schedule を含め、学生や地域にとって意義のあるサービスを開発することでプログラミングの技術向上に努める。
活動日程
@DataAnalitics は毎週金曜日の 17:00 ~ 18:30 を主な活動時間とし、オンラインで問題に取り組んだりする時間とする。
@WebDev は不定期の活動とする。
第1回 Engine_to_make_DS_Club_site議録
2021-01-12(19時00分~21時00分)
やること - かける、うらさん、もろた、たくみくんでマネジメントを回す
- メインはうらさん、もろた たくみくんはサポート
- 日曜日の 19:00~20:00
- かけるが参加できない場合はリスケ それ以外は続行
内容
次にやるタスクの作成 空いている人がいたらすぐに割り振れるようにする
優先順位をつける
今日の確認
- もりけん git を教える(もろた)