diff --git a/12-spatial-cv-ja.Rmd b/12-spatial-cv-ja.Rmd index 53d158d..7067a47 100644 --- a/12-spatial-cv-ja.Rmd +++ b/12-spatial-cv-ja.Rmd @@ -44,7 +44,7 @@ library(progressr) # 進捗状況を報告 どちらも物理学、生物学、生態学から地理学、経済学に至るまで、ますます多くの分野で利用されるようになっている [@james_introduction_2013]。 この章では、クラスタリング\index{くらすたりんぐ@クラスタリング}のような教師なし技術ではなく、学習データセットが存在する教師あり技術に焦点を当てていきたい。 -応答変数は、二値 (地すべりの発生など)、カテゴリ (土地利用)、整数 (種の豊富さ)、数値 (土壌酸性度の測定された pH 値) のいずれでもよい。 +応答変数は、二値 (地すべりの発生など)、カテゴリ (土地利用)、整数 (種の豊富さ)、数値 (土壌酸性度の pH 測定値) のいずれでもよい。 教師あり技術は、観測のサンプルについて既知の応答と、1 つまたは複数の予測変数の間の関係をモデル化する。 多くの機械学習\index{きかいがくしゅう@機械学習}において、研究の主な目的は優れた予測を行うことである。 @@ -647,7 +647,7 @@ GLM\index{GLM} は、この特定のケースでは、SVM\index{SVM} よりも Section \@ref(intro-cv) で述べたように、空間座標を持つ観測は、空間自己相関\index{じこそうかん@自己相関!くうかん@空間}のために統計的に独立でない場合があり、交差検証の基本的な仮定に違反する。 空間交差検証\index{こうさけんしょう@交差検証!くうかん@空間} この問題は、空間的自己相関\index{じこそうかん@自己相関!くうかん@空間}によってもたらされるバイアスを低減することで解決される。 -**mlr3**\index{mlr3 (package)} パッケージは、線形回帰\index{かいき@回帰!せんけい@線形}、一般化加法モデル\index{いっぱんかかほうもでる@一般化加法モデル}などのセミパラメトリックモデルなどの統計学習\index{とうけいてきがくしゅう@統計的学習}、あるいはランダムフォレスト\index{らんだむふぉれすと@ランダムフォレスト}、SVM \index{SVM}、ブースト回帰木 [@bischl_mlr:_2016;@schratz_hyperparameter_2019] などの機械学習\index{きかいがくしゅう@機械学習} 技術と組み合わせることで、 (空間) リサンプリング技法\index{resampling}を容易にしている。 +**mlr3**\index{mlr3 (package)} パッケージは、線形回帰\index{かいき@回帰!せんけい@線形}、一般化加法モデル\index{いっぱんかかほうもでる@一般化加法モデル}などのセミパラメトリックモデルなどの統計学習\index{とうけいてきがくしゅう@統計的学習}、あるいはランダムフォレスト\index{らんだむふぉれすと@ランダムフォレスト}、SVM \index{SVM}、ブースト回帰木 [@bischl_mlr:_2016;@schratz_hyperparameter_2019] などの機械学習\index{きかいがくしゅう@機械学習} 技術と組み合わせることで、 (空間) リサンプリング技法\index{りさんぷりんぐ@リサンプリング}を容易にしている。 機械学習アルゴリズムは、ハイパーパラメータ\index{はいぱーぱらめーた@ハイパーパラメータ}の入力を必要とすることがある。その最適な「チューニング」には、大規模な計算資源を必要とする数千回のモデル実行が必要で、多くの時間、RAM、コアを消費することがある。 **mlr3** は、並列化\index{へいれつか@並列化}を可能にすることでこの問題に取り組んでいる。 diff --git a/15-eco-ja.Rmd b/15-eco-ja.Rmd index ee2f8e9..dca8598 100644 --- a/15-eco-ja.Rmd +++ b/15-eco-ja.Rmd @@ -41,7 +41,7 @@ library(vegan) # 生態学 残念ながら、霧のオアシスは、主に人間の活動により、大きく危機に瀕している。 残されたユニークな植生生態系を効果的に保護するためには、原生植物相の構成と空間分布に関するエビデンスが必要である [@muenchow_predictive_2013; @muenchow_soil_2013]。 -この章では、Peru の中央北岸に位置するカスマ近郊の**ロマ植生**山である Mongón 山の南斜面における維管束植物 (ここでは主に顕花植物) の組成と空間分布を分析する (Figure \@ref(fig:study-area-mongon))。 +この章では、Peru の中央北岸に位置する Casma 近郊の**ロマ植生**山である Mongón 山の南斜面における維管束植物 (ここでは主に顕花植物) の組成と空間分布を分析する (Figure \@ref(fig:study-area-mongon))。 Mongón 山での野外調査において、2011年の冬に無作為にサンプリングした 4 x 4 m^2^ の 100 区画に生息する維管束植物をすべて記録した [@muenchow_predictive_2013]。 このサンプリングは、米国海洋大気庁 ([NOAA](https://origin.cpc.ncep.noaa.gov/products/analysis_monitoring/ensostuff/ONI_v5.php)) が発表したデータに示されているように、その年の強いラニーニャ現象が発生した時期と重なった。 このため、沿岸部の砂漠では例年よりもさらに高いレベルの乾燥が発生し、Peru の**ロマ植生**山脈の南斜面では霧の活動が活発化した。 @@ -441,11 +441,11 @@ Section \@ref(svm) で、100 回繰り返しの 5 回空間交差検証\index{ このチューニングは、バイアスを低減した性能推定値を得るために行われたものであり、最良の空間予測を行うために行われたものではないことに留意してみよう。 後者については、完全なデータセットから最適なハイパーパラメータ\index{はいぱーぱらめーた@ハイパーパラメータ}の組み合わせを推定する。 これは、内部のハイパーパラメータ\index{はいぱーぱらめーた@ハイパーパラメータ}のチューニング・レベルがもはや必要ないことを意味する。なぜなら、真のアウトカムが不明の新しいデータ (未訪問のフィールド観測) にこのモデルを適用するので、テストはいかなる場合でも不可能なのである。 -そこで、5回繰り返しの空間 CV\index{こうさけんしょう@交差検証!くうかんこうさけんしょう@空間交差検証} によって、完全なデータセットで良好な空間予測を行うためにハイパーパラメータ\index{はいぱーぱらめーた@ハイパーパラメータ}を調整することにした。 +そこで、5 回繰り返しの空間 CV\index{こうさけんしょう@交差検証!くうかんこうさけんしょう@空間交差検証} によって、完全なデータセットで良好な空間予測を行うためにハイパーパラメータ\index{はいぱーぱらめーた@ハイパーパラメータ}を調整することにした。 既に入力変数 (`rp`) を構築しているので、**mlr3**\index{mlr3 (package)} の構成要素 (タスク、学習器、リサンプリング) を指定するための準備は全て整っている。 -空間タスクの指定には、再び **mlr3spatiotempcv** パッケージを使用する [@schratz_mlr3spatiotempcv_2021 & Section \@ref(spatial-cv-with-mlr3) ]。そして、私たちの応答 (`sc`) は数値なので、回帰\index{かいき@回帰}タスクを使用する。 +空間タスクの指定には、再び **mlr3spatiotempcv** パッケージを使用する [@schratz_mlr3spatiotempcv_2021 & Section \@ref(spatial-cv-with-mlr3) ]。そして、応答 (`sc`) は数値なので、回帰\index{かいき@回帰}タスクを使用する。 ```{r 15-eco-20} # task を作成 @@ -458,7 +458,7 @@ task = mlr3spatiotempcv::as_task_regr_st( バックエンドとして `sf` オブジェクトを使用すると、後の空間分割に必要なジオメトリ情報が自動的に提供される。 さらに、`id` と `spri` の列は、これらの変数をモデリングにおける予測因子として使用すべきではないため、削除した。 -次に、**ranger** パッケージのランダムフォレスト\index{らんだむふぉれすと@ランダムフォレスト} 学習器を構築する [@wright_ranger_2017]。 +次に、**ranger** パッケージのランダムフォレスト\index{らんだむふぉれすと@ランダムフォレスト}学習器を構築する [@wright_ranger_2017]。 ```{r 15-eco-21} lrn_rf = lrn("regr.ranger", predict_type = "response") diff --git a/_09-ex-ja.Rmd b/_09-ex-ja.Rmd index 38ab404..189d8ba 100644 --- a/_09-ex-ja.Rmd +++ b/_09-ex-ja.Rmd @@ -28,9 +28,9 @@ nlcd = rast(system.file("raster/nlcd.tif", package = "spDataLarge")) E1. **graphics** (ヒント: `plot()`) と **tmap** パッケージ (ヒント: `tm_shape(africa) + ...`) を使って、Africa 全土の人間開発指数 (`HDI`) の地理的分布を示す地図を作成しなさい。 - - それぞれの長所を経験に基づいて 2 つ挙げなさい。 - - 他の地図作成パッケージを 3 つ挙げ、それぞれの利点を挙げなさい。 - - ボーナス: これら 3 つの他のパッケージを使って、さらに 3 つのアフリカの地図を作りなさい。 + - それぞれの長所を経験に基づいて 2 つ挙げなさい。 + - 他の地図作成パッケージを 3 つ挙げ、それぞれの利点を挙げなさい。 + - ボーナス: これら 3 つの他のパッケージを使って、さらに 3 つのアフリカの地図を作りなさい。 ```{r} # graphics @@ -56,7 +56,7 @@ mf_map(x = africa, var = "HDI", type = "choro") E2. 前の演習で作成した **tmap** を拡張して、凡例に 3 つのビンを設定しなさい: "High" (0.7 を超える `HDI`)、"Medium" (0.55 と 0.7 の間の `HDI`)、"Low" (0.55 を下回る `HDI`)。 - - ボーナス: 例えば、凡例のタイトル、クラスラベル、色パレットを変更することで、マップの美観を改善しなさい。 + - ボーナス: 例えば、凡例のタイトル、クラスラベル、色パレットを変更することで、マップの美観を改善しなさい。 ```{r} library(tmap) @@ -88,9 +88,9 @@ tmap_arrange(ahdi, asubregions) E4. Zion 国立公園の土地被覆マップを作成しなさい。 - - 土地被覆カテゴリの認識に合わせてデフォルトの色を変更 - - 縮尺バーと北矢印を追加し、両方の位置を変更して地図の美観を向上 - - ボーナス: ザイオン国立公園のユタ州との位置関係を示す挿入地図を追加 (ヒント: ユタを表すオブジェクトは `us_states` データセットから抽出できる)。 + - 土地被覆カテゴリの認識に合わせてデフォルトの色を変更 + - 縮尺バーと北矢印を追加し、両方の位置を変更して地図の美観を向上 + - ボーナス: ザイオン国立公園のユタ州との位置関係を示す挿入地図を追加 (ヒント: ユタを表すオブジェクトは `us_states` データセットから抽出できる)。 ```{r} tm_shape(nlcd) + @@ -152,8 +152,8 @@ print(inset, vp = ins_vp) E5. Eastern Africa の国々のファセットマップを作成しなさい。 - - 1 つのファセットは HDI を表し、もう 1 つのファセットは人口増加を表す (ヒント: それぞれ変数`HDI`と`pop_growth`を使用) - - 国ごとに「小さな倍数」を設定 + - 1 つのファセットは HDI を表し、もう 1 つのファセットは人口増加を表す (ヒント: それぞれ変数`HDI`と`pop_growth`を使用) + - 国ごとに「小さな倍数」を設定 ```{r} ea = subset(africa, subregion == "Eastern Africa") @@ -168,8 +168,8 @@ tm_shape(ea) + E6. これまでのファセット地図の例に基づいて、East Africa の地図アニメーションを作成しなさい。 - - 各国を順番に表示 - - HDI を示す凡例とともに各国を順番に表示 + - 各国を順番に表示 + - HDI を示す凡例とともに各国を順番に表示 ```{r, eval=FALSE} tma1 = tm_shape(ea) + @@ -191,10 +191,10 @@ browseURL("tma2.gif") E7. Africa における HDI のインタラクティブ地図を作成しなさい。 - - **tmap** - - **mapview** - - **leaflet** - - ボーナス: 各アプローチについて、凡例 (自動的に提供されない場合) とスケールバーを追加しなさい。 + - **tmap** + - **mapview** + - **leaflet** + - ボーナス: 各アプローチについて、凡例 (自動的に提供されない場合) とスケールバーを追加しなさい。 ```{r, eval=FALSE} # tmap @@ -215,24 +215,24 @@ leaflet(africa4326) |> E8. 交通政策や土地利用政策をよりエビデンスに基づいたものにするために使用できるウェブ地図アプリのアイデアを紙にスケッチしなさい。 - - あなたが住んでいる都市で、1 日あたり数人のユーザー向け - - あなたが住んでいる国で、1 日あたり数十人のユーザー向け - - 世界中、1 日あたり数百人のユーザーと大規模なデータ配信が必要な場合 + - あなたが住んでいる都市で、1 日あたり数人のユーザー向け + - あなたが住んでいる国で、1 日あたり数十人のユーザー向け + - 世界中、1 日あたり数百人のユーザーと大規模なデータ配信が必要な場合 ```{asis} アイデアとしては、現在多くの人が車で短距離を移動しているルートの特定、公園へのアクセスを促す方法、長距離移動を減らすための新規開発の優先順位付けなどが考えられる。 都市レベルでは、ウェブ地図で十分である。 -国レベルでは、例えば、光沢のある地図アプリケーションが必要だろう。 +国レベルでは、例えば、shiny 地図アプリケーションが必要だろう。 世界レベルでは、データを提供するデータベースが必要になるだろう。そして、様々なフロントエンドがこれに接続できる。 ``` E9. `coffeeApp/app.R` のコードを更新し、Brazil を中心に表示するのではなく、ユーザーがどの国を中心に表示するかを選択しなさい。 - - `textInput()` を使いなさい - - `selectInput()` を使いなさい + - `textInput()` を使いなさい + - `selectInput()` を使いなさい ```{asis} The answer can be found in the `shinymod` branch of the geocompr repo: https://github.com/Robinlovelace/geocompr/pull/318/files @@ -240,7 +240,7 @@ You create the new widget and then use it to set the center. Note: the input data must be fed into the map earlier to prevent the polygons disappearing when you change the center this way. ``` -E10. **ggplot2** パッケージを使用して、Figure 9.1 と Figure 9.7をできるだけ忠実に再現しなさい。 +E10. **ggplot2** パッケージを使用して、Figure 9.1 と Figure 9.7 をできるだけ忠実に再現しなさい。 ```{r} library(ggplot2)