-
Notifications
You must be signed in to change notification settings - Fork 27.4k
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Add model_docs from cpmant.md to derformable_detr.md (#27884)
* upfaste * Update * Update docs/source/ja/model_doc/deformable_detr.md Co-authored-by: Steven Liu <[email protected]> * Update docs/source/ja/model_doc/data2vec.md Co-authored-by: Steven Liu <[email protected]> * Update docs/source/ja/model_doc/cvt.md Co-authored-by: Steven Liu <[email protected]> * add suggestions * Toctree update * remove git references * Update docs/source/ja/_toctree.yml Co-authored-by: Steven Liu <[email protected]> * Update docs/source/ja/model_doc/decision_transformer.md Co-authored-by: Steven Liu <[email protected]> --------- Co-authored-by: Steven Liu <[email protected]>
- Loading branch information
Showing
9 changed files
with
914 additions
and
0 deletions.
There are no files selected for viewing
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,47 @@ | ||
<!--Copyright 2022 The HuggingFace Team and The OpenBMB Team. All rights reserved. | ||
Licensed under the Apache License, Version 2.0 (the "License"); you may not use this file except in compliance with | ||
the License. You may obtain a copy of the License at | ||
http://www.apache.org/licenses/LICENSE-2.0 | ||
Unless required by applicable law or agreed to in writing, software distributed under the License is distributed on | ||
an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the License for the | ||
specific language governing permissions and limitations under the License. | ||
⚠️ Note that this file is in Markdown but contain specific syntax for our doc-builder (similar to MDX) that may not be | ||
rendered properly in your Markdown viewer. | ||
--> | ||
|
||
# CPMAnt | ||
|
||
## Overview | ||
|
||
CPM-Ant は、10B パラメータを備えたオープンソースの中国語の事前トレーニング済み言語モデル (PLM) です。これは、CPM-Live のライブ トレーニング プロセスの最初のマイルストーンでもあります。トレーニングプロセスは費用対効果が高く、環境に優しいものです。 CPM-Ant は、CUGE ベンチマークでのデルタ チューニングでも有望な結果を達成しています。フル モデルに加えて、さまざまなハードウェア構成の要件を満たすさまざまな圧縮バージョンも提供しています。 [詳細を見る](https://github.com/OpenBMB/CPM-Live/tree/cpm-ant/cpm-live) | ||
|
||
このモデルは [OpenBMB](https://huggingface.co/openbmb) によって提供されました。元のコードは [ここ](https://github.com/OpenBMB/CPM-Live/tree/cpm-ant/cpm-live) にあります。 | ||
|
||
## Resources | ||
|
||
- [CPM-Live](https://github.com/OpenBMB/CPM-Live/tree/cpm-ant/cpm-live) に関するチュートリアル。 | ||
|
||
## CpmAntConfig | ||
|
||
[[autodoc]] CpmAntConfig | ||
- all | ||
|
||
## CpmAntTokenizer | ||
|
||
[[autodoc]] CpmAntTokenizer | ||
- all | ||
|
||
## CpmAntModel | ||
|
||
[[autodoc]] CpmAntModel | ||
- all | ||
|
||
## CpmAntForCausalLM | ||
|
||
[[autodoc]] CpmAntForCausalLM | ||
- all |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,113 @@ | ||
<!--Copyright 2020 The HuggingFace Team. All rights reserved. | ||
Licensed under the Apache License, Version 2.0 (the "License"); you may not use this file except in compliance with | ||
the License. You may obtain a copy of the License at | ||
http://www.apache.org/licenses/LICENSE-2.0 | ||
Unless required by applicable law or agreed to in writing, software distributed under the License is distributed on | ||
an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the License for the | ||
specific language governing permissions and limitations under the License. | ||
⚠️ Note that this file is in Markdown but contain specific syntax for our doc-builder (similar to MDX) that may not be | ||
rendered properly in your Markdown viewer. | ||
--> | ||
|
||
# CTRL | ||
|
||
<div class="flex flex-wrap space-x-1"> | ||
<a href="https://huggingface.co/models?filter=ctrl"> | ||
<img alt="Models" src="https://img.shields.io/badge/All_model_pages-ctrl-blueviolet"> | ||
</a> | ||
<a href="https://huggingface.co/spaces/docs-demos/tiny-ctrl"> | ||
<img alt="Spaces" src="https://img.shields.io/badge/%F0%9F%A4%97%20Hugging%20Face-Spaces-blue"> | ||
</a> | ||
</div> | ||
|
||
## Overview | ||
|
||
CTRL モデルは、Nitish Shirish Keskar*、Bryan McCann*、Lav R. Varshney、Caiming Xiong, Richard Socher によって [CTRL: A Conditional Transformer Language Model for Controllable Generation](https://arxiv.org/abs/1909.05858) で提案されました。 | ||
リチャード・ソーチャー。これは、非常に大規模なコーパスの言語モデリングを使用して事前トレーニングされた因果的 (一方向) トランスフォーマーです | ||
最初のトークンが制御コード (リンク、書籍、Wikipedia など) として予約されている、約 140 GB のテキスト データ。 | ||
|
||
論文の要約は次のとおりです。 | ||
|
||
*大規模な言語モデルは有望なテキスト生成機能を示していますが、ユーザーは特定の言語モデルを簡単に制御できません | ||
生成されたテキストの側面。 16 億 3,000 万パラメータの条件付きトランスフォーマー言語モデルである CTRL をリリースします。 | ||
スタイル、コンテンツ、タスク固有の動作を制御する制御コードを条件付けるように訓練されています。制御コードは | ||
生のテキストと自然に共生する構造から派生し、教師なし学習の利点を維持しながら、 | ||
テキスト生成をより明示的に制御できるようになります。これらのコードを使用すると、CTRL でどの部分が予測されるのかを予測することもできます。 | ||
トレーニング データにはシーケンスが与えられる可能性が最も高くなります。これにより、大量のデータを分析するための潜在的な方法が提供されます。 | ||
モデルベースのソース帰属を介して。* | ||
|
||
このモデルは、[keskarnitishr](https://huggingface.co/keskarnitishr) によって提供されました。元のコードが見つかる | ||
[こちら](https://github.com/salesforce/ctrl)。 | ||
|
||
## Usage tips | ||
|
||
- CTRL は制御コードを利用してテキストを生成します。生成を特定の単語や文で開始する必要があります。 | ||
またはリンクして一貫したテキストを生成します。 [元の実装](https://github.com/salesforce/ctrl) を参照してください。 | ||
詳しくは。 | ||
- CTRL は絶対位置埋め込みを備えたモデルであるため、通常は入力を右側にパディングすることをお勧めします。 | ||
左。 | ||
- CTRL は因果言語モデリング (CLM) の目的でトレーニングされているため、次の予測に強力です。 | ||
シーケンス内のトークン。この機能を利用すると、CTRL は構文的に一貫したテキストを生成できるようになります。 | ||
*run_generation.py* サンプル スクリプトで確認できます。 | ||
- PyTorch モデルは、以前に計算されたキーと値のアテンション ペアである`past_key_values`を入力として受け取ることができます。 | ||
TensorFlow モデルは`past`を入力として受け入れます。 `past_key_values`値を使用すると、モデルが再計算されなくなります。 | ||
テキスト生成のコンテキストで事前に計算された値。 [`forward`](model_doc/ctrl#transformers.CTRLModel.forward) を参照してください。 | ||
この引数の使用法の詳細については、メソッドを参照してください。 | ||
|
||
## Resources | ||
|
||
- [テキスト分類タスクガイド](../tasks/sequence_classification) | ||
- [因果言語モデリング タスク ガイド](../tasks/language_modeling) | ||
|
||
## CTRLConfig | ||
|
||
[[autodoc]] CTRLConfig | ||
|
||
## CTRLTokenizer | ||
|
||
[[autodoc]] CTRLTokenizer | ||
- save_vocabulary | ||
|
||
<frameworkcontent> | ||
<pt> | ||
|
||
## CTRLModel | ||
|
||
[[autodoc]] CTRLModel | ||
- forward | ||
|
||
## CTRLLMHeadModel | ||
|
||
[[autodoc]] CTRLLMHeadModel | ||
- forward | ||
|
||
## CTRLForSequenceClassification | ||
|
||
[[autodoc]] CTRLForSequenceClassification | ||
- forward | ||
|
||
</pt> | ||
<tf> | ||
|
||
## TFCTRLModel | ||
|
||
[[autodoc]] TFCTRLModel | ||
- call | ||
|
||
## TFCTRLLMHeadModel | ||
|
||
[[autodoc]] TFCTRLLMHeadModel | ||
- call | ||
|
||
## TFCTRLForSequenceClassification | ||
|
||
[[autodoc]] TFCTRLForSequenceClassification | ||
- call | ||
|
||
</tf> | ||
</frameworkcontent> |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,88 @@ | ||
<!--Copyright 2022 The HuggingFace Team. All rights reserved. | ||
Licensed under the Apache License, Version 2.0 (the "License"); you may not use this file except in compliance with | ||
the License. You may obtain a copy of the License at | ||
http://www.apache.org/licenses/LICENSE-2.0 | ||
Unless required by applicable law or agreed to in writing, software distributed under the License is distributed on | ||
an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the License for the | ||
specific language governing permissions and limitations under the License. | ||
⚠️ Note that this file is in Markdown but contain specific syntax for our doc-builder (similar to MDX) that may not be | ||
rendered properly in your Markdown viewer. | ||
--> | ||
|
||
# Convolutional Vision Transformer (CvT) | ||
|
||
## Overview | ||
|
||
CvT モデルは、Haping Wu、Bin Xiao、Noel Codella、Mengchen Liu、Xiyang Dai、Lu Yuan、Lei Zhang によって [CvT: Introduction Convolutions to Vision Transformers](https://arxiv.org/abs/2103.15808) で提案されました。畳み込みビジョン トランスフォーマー (CvT) は、ViT に畳み込みを導入して両方の設計の長所を引き出すことにより、[ビジョン トランスフォーマー (ViT)](vit) のパフォーマンスと効率を向上させます。 | ||
|
||
論文の要約は次のとおりです。 | ||
|
||
*この論文では、ビジョン トランスフォーマー (ViT) を改善する、畳み込みビジョン トランスフォーマー (CvT) と呼ばれる新しいアーキテクチャを紹介します。 | ||
ViT に畳み込みを導入して両方の設計の長所を引き出すことで、パフォーマンスと効率を向上させます。これは次のようにして実現されます。 | ||
2 つの主要な変更: 新しい畳み込みトークンの埋め込みを含むトランスフォーマーの階層と、畳み込みトランスフォーマー | ||
畳み込み射影を利用したブロック。これらの変更により、畳み込みニューラル ネットワーク (CNN) の望ましい特性が導入されます。 | ||
トランスフォーマーの利点 (動的な注意力、 | ||
グローバルなコンテキストとより良い一般化)。私たちは広範な実験を実施することで CvT を検証し、このアプローチが達成できることを示しています。 | ||
ImageNet-1k 上の他のビジョン トランスフォーマーや ResNet よりも、パラメータが少なく、FLOP が低い、最先端のパフォーマンスを実現します。加えて、 | ||
より大きなデータセット (例: ImageNet-22k) で事前トレーニングし、下流のタスクに合わせて微調整すると、パフォーマンスの向上が維持されます。事前トレーニング済み | ||
ImageNet-22k、当社の CvT-W24 は、ImageNet-1k val set で 87.7\% というトップ 1 の精度を獲得しています。最後に、私たちの結果は、位置エンコーディングが、 | ||
既存のビジョン トランスフォーマーの重要なコンポーネントであるこのコンポーネントは、モデルでは安全に削除できるため、高解像度のビジョン タスクの設計が簡素化されます。* | ||
|
||
このモデルは [anugunj](https://huggingface.co/anugunj) によって提供されました。元のコードは [ここ](https://github.com/microsoft/CvT) にあります。 | ||
|
||
## Usage tips | ||
|
||
- CvT モデルは通常の Vision Transformer ですが、畳み込みでトレーニングされています。 ImageNet-1K および CIFAR-100 で微調整すると、[オリジナル モデル (ViT)](vit) よりも優れたパフォーマンスを発揮します。 | ||
- カスタム データの微調整だけでなく推論に関するデモ ノートブックも [ここ](https://github.com/NielsRogge/Transformers-Tutorials/tree/master/VisionTransformer) で確認できます ([`ViTFeatureExtractor を置き換えるだけで済みます) `] による [`AutoImageProcessor`] および [`ViTForImageClassification`] による [`CvtForImageClassification`])。 | ||
- 利用可能なチェックポイントは、(1) [ImageNet-22k](http://www.image-net.org/) (1,400 万の画像と 22,000 のクラスのコレクション) でのみ事前トレーニングされている、(2) も問題ありません。 ImageNet-22k で調整、または (3) [ImageNet-1k](http://www.image-net.org/challenges/LSVRC/2012/) (ILSVRC 2012 とも呼ばれるコレクション) でも微調整130万の | ||
画像と 1,000 クラス)。 | ||
|
||
## Resources | ||
|
||
CvT を始めるのに役立つ公式 Hugging Face およびコミュニティ (🌎 で示される) リソースのリスト。 | ||
|
||
<PipelineTag pipeline="image-classification"/> | ||
|
||
- [`CvtForImageClassification`] は、この [サンプル スクリプト](https://github.com/huggingface/transformers/tree/main/examples/pytorch/image-classification) および [ノートブック](https://colab.research.google.com/github/huggingface/notebooks/blob/main/examples/image_classification.ipynb)。 | ||
- 参照: [画像分類タスク ガイド](../tasks/image_classification) | ||
|
||
ここに含めるリソースの送信に興味がある場合は、お気軽にプル リクエストを開いてください。審査させていただきます。リソースは、既存のリソースを複製するのではなく、何か新しいものを示すことが理想的です。 | ||
|
||
## CvtConfig | ||
|
||
[[autodoc]] CvtConfig | ||
|
||
<frameworkcontent> | ||
<pt> | ||
|
||
## CvtModel | ||
|
||
[[autodoc]] CvtModel | ||
- forward | ||
|
||
## CvtForImageClassification | ||
|
||
[[autodoc]] CvtForImageClassification | ||
- forward | ||
|
||
</pt> | ||
<tf> | ||
|
||
## TFCvtModel | ||
|
||
[[autodoc]] TFCvtModel | ||
- call | ||
|
||
## TFCvtForImageClassification | ||
|
||
[[autodoc]] TFCvtForImageClassification | ||
- call | ||
|
||
</tf> | ||
</frameworkcontent> | ||
|
Oops, something went wrong.