更新済みの2022年02月 DP-100日本語試験練習テスト問題
検証済みDP-100日本語問題集と解答100%一発合格保証で更新された問題集
質問 94
機械学習モデルを作成しています。
データ内の外れ値を識別する必要があります。
どの2つの視覚エフェクトを使用できますか?それぞれの正解は完全な解決策を提示します。
注:それぞれの正しい選択には1ポイントの価値があります。
注:それぞれの正しい選択には1ポイントの価値があります。
- A. Venn diagram
- B. ROC curve
- C. scatter
- D. box plot
- E. random forest diagram
正解: C,D
解説:
Explanation
The box-plot algorithm can be used to display outliers.
One other way to quickly identify Outliers visually is to create scatter plots.
References:
https://blogs.msdn.microsoft.com/azuredev/2017/05/27/data-cleansing-tools-in-azure-machine-learning/
質問 95
Azure Machine Learningワークスペースで自動機械学習実験を実行します。実行に関する情報を以下の表に示します。
Azure Machine Learning SDKを使用するスクリプトを記述して、実験実行の最適な反復を取得する必要があります。どのPythonコードセグメントを使用する必要がありますか?
A)
B)
C)
D)
- A. オプションA
- B. オプションB
- C. オプションC
- D. オプションD
正解: D
質問 96
Azure Machine Learning Serviceを使用して、ニューラルネットワーク分類モデルのハイパーパラメーター探索を自動化しています。
次の要件に従ってランダムサンプリングを使用してハイパーパラメーターを自動的に調整するには、ハイパーパラメーター空間を定義する必要があります。
*学習率は、平均値が10、標準偏差が3の正規分布から選択する必要があります。
*バッチサイズは16、32、64でなければなりません。
*維持確率は、0.05から0.1の範囲の均一な分布から選択された値でなければなりません。
Azure Machine Learning ServiceのPython APIのparam_samplingメソッドを使用する必要があります。
コードセグメントをどのように完成させる必要がありますか? 回答するには、回答エリアで適切なオプションを選択します。
注:それぞれの正しい選択には1ポイントの価値があります。
正解:
解説:
Explanation:
In random sampling, hyperparameter values are randomly selected from the defined search space. Random sampling allows the search space to include both discrete and continuous hyperparameters.
Example:
from azureml.train.hyperdrive import RandomParameterSampling
param_sampling = RandomParameterSampling( {
"learning_rate": normal(10, 3),
"keep_probability": uniform(0.05, 0.1),
"batch_size": choice(16, 32, 64)
}
Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/service/how-to-tune-hyperparameters
質問 97
新しいAzureサブスクリプションを作成します。サブスクリプションでリソースはプロビジョニングされません。
Azure Machine Learningワークスペースを作成する必要があります。
この目標を達成するための3つの可能な方法は何ですか?それぞれの正解は完全なソリューションを示します。
注:それぞれの正しい選択は1ポイントの価値があります。
- A. Azure ML SDKライブラリを使用するPythonコードを実行し、names、subscriptionjd、resource_group、およびlocationパラメーターを指定してWorkspacesreateメソッドを呼び出します。
- B. Azure ML SDKライブラリを使用して、name、subscriptionjd、およびresource.groupパラメーターを指定してWorkspace.getメソッドを呼び出すPythonコードを実行します。
- C. Azure Machine Learning Studioに移動し、ワークスペースを作成します。
- D. 次を含むAzureリソース管理テンプレートを使用します
Microsoft.MachineLearningServices / workspacesリソースとその依存関係。 - E. Azure Machine Learning拡張機能でAzureコマンドラインインターフェイス(CLI)を使用して、-nameおよび-locationパラメーターを指定してaz group create関数を呼び出し、次に-wおよび-gパラメーターを指定してaz ml workspace create関数を呼び出します。ワークスペース名とリソースグループ。
正解: A,B,C
質問 98
Azure Machine Learning Studioで実験を作成します-10.000行を含むトレーニングデータセットを追加します。最初の9.000行はクラス0(90パーセント)を表します。最初の1.000行はクラス1(10パーセント)を表します。
トレーニングセットは2つのクラス間で不均衡です。データ行を使用して、クラス1のトレーニング例の数を4,000に増やす必要があります。 Synthetic Minority Oversampling Technique(SMOTE)モジュールを実験に追加します。
モジュールを構成する必要があります。
どの値を使用する必要がありますか?回答するには、回答領域のダイアログボックスで適切なオプションを選択します。
注:それぞれの正しい選択には1ポイントの価値があります。
正解:
解説:
質問 99
クリーニングが必要な生のデータセットを分析しています。
Azure Machine Learning Studioを使用して、変換と操作を実行する必要があります。
変換を実行するには、正しいモジュールを識別する必要があります。
どのモジュールを選択する必要がありますか?答えるには、適切なモジュールを正しいシナリオにドラッグします。各モジュールは、1回、複数回使用することも、まったく使用しないこともできます。
コンテンツを表示するには、ペイン間で分割バーをドラッグするか、スクロールする必要がある場合があります。
注:それぞれの正しい選択には1ポイントの価値があります。
正解:
解説:
Explanation:
Box 1: Clean Missing Data
Box 2: SMOTE
Use the SMOTE module in Azure Machine Learning Studio to increase the number of underepresented cases in a dataset used for machine learning. SMOTE is a better way of increasing the number of rare cases than simply duplicating existing cases.
Box 3: Convert to Indicator Values
Use the Convert to Indicator Values module in Azure Machine Learning Studio. The purpose of this module is to convert columns that contain categorical values into a series of binary indicator columns that can more easily be used as features in a machine learning model.
Box 4: Remove Duplicate Rows
References:
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/smote
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/convert-to-indicator-values
質問 100
次の形式のsalesDataという名前のPythonデータフレームがあります。
データフレームは、次のように長いデータ形式にピボット解除する必要があります。
変換を実行するには、Pythonでpandas.melt()関数を使用する必要があります。
コードセグメントをどのように完了する必要がありますか?回答するには、回答領域で適切なオプションを選択します。
注:正しい選択はそれぞれ1ポイントの価値があります。
正解:
解説:
References:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.melt.html
質問 101
パフォーマンスカーブの図に示されているように、広告応答モデルの新しいコストファクターシナリオを実装する必要があります。
どのテクニックを使用する必要がありますか?
- A. Set the threshold to 0.2 and retrain if weighted Kappa deviates +/- 5% from 0.6.
- B. Set the threshold to 0.75 and retrain if weighted Kappa deviates +/- 5% from 0.15.
- C. Set the threshold to 0.5 and retrain if weighted Kappa deviates +/- 5% from 0.45.
- D. Set the threshold to 0.05 and retrain if weighted Kappa deviates +/- 5% from 0.5.
正解: C
解説:
Explanation
Scenario:
Performance curves of current and proposed cost factor scenarios are shown in the following diagram:
The ad propensity model uses a cut threshold is 0.45 and retrains occur if weighted Kappa deviated from 0.1
+/- 5%.
Topic 2, Case Study 2
Case study
Overview
You are a data scientist for Fabrikam Residences, a company specializing in quality private and commercial property in the United States. Fabrikam Residences is considering expanding into Europe and has asked you to investigate prices for private residences in major European cities. You use Azure Machine Learning Studio to measure the median value of properties. You produce a regression model to predict property prices by using the Linear Regression and Bayesian Linear Regression modules.
Datasets
There are two datasets in CSV format that contain property details for two cities, London and Paris, with the following columns:
The two datasets have been added to Azure Machine Learning Studio as separate datasets and included as the starting point of the experiment.
Dataset issues
The AccessibilityToHighway column in both datasets contains missing values. The missing data must be replaced with new data so that it is modeled conditionally using the other variables in the data before filling in the missing values.
Columns in each dataset contain missing and null values. The dataset also contains many outliers. The Age column has a high proportion of outliers. You need to remove the rows that have outliers in the Age column.
The MedianValue and AvgRoomsinHouse columns both hold data in numeric format. You need to select a feature selection algorithm to analyze the relationship between the two columns in more detail.
Model fit
The model shows signs of overfitting. You need to produce a more refined regression model that reduces the overfitting.
Experiment requirements
You must set up the experiment to cross-validate the Linear Regression and Bayesian Linear Regression modules to evaluate performance.
In each case, the predictor of the dataset is the column named MedianValue. An initial investigation showed that the datasets are identical in structure apart from the MedianValue column. The smaller Paris dataset contains the MedianValue in text format, whereas the larger London dataset contains the MedianValue in numerical format. You must ensure that the datatype of the MedianValue column of the Paris dataset matches the structure of the London dataset.
You must prioritize the columns of data for predicting the outcome. You must use non-parameters statistics to measure the relationships.
You must use a feature selection algorithm to analyze the relationship between the MedianValue and AvgRoomsinHouse columns.
Model training
Given a trained model and a test dataset, you need to compute the permutation feature importance scores of feature variables. You need to set up the Permutation Feature Importance module to select the correct metric to investigate the model's accuracy and replicate the findings.
You want to configure hyperparameters in the model learning process to speed the learning phase by using hyperparameters. In addition, this configuration should cancel the lowest performing runs at each evaluation interval, thereby directing effort and resources towards models that are more likely to be successful.
You are concerned that the model might not efficiently use compute resources in hyperparameter tuning. You also are concerned that the model might prevent an increase in the overall tuning time. Therefore, you need to implement an early stopping criterion on models that provides savings without terminating promising jobs.
Testing
You must produce multiple partitions of a dataset based on sampling using the Partition and Sample module in Azure Machine Learning Studio. You must create three equal partitions for cross-validation. You must also configure the cross-validation process so that the rows in the test and training datasets are divided evenly by properties that are near each city's main river. The data that identifies that a property is near a river is held in the column named NextToRiver. You want to complete this task before the data goes through the sampling process.
When you train a Linear Regression module using a property dataset that shows data for property prices for a large city, you need to determine the best features to use in a model. You can choose standard metrics provided to measure performance before and after the feature importance process completes. You must ensure that the distribution of the features across multiple training models is consistent.
Data visualization
You need to provide the test results to the Fabrikam Residences team. You create data visualizations to aid in presenting the results.
You must produce a Receiver Operating Characteristic (ROC) curve to conduct a diagnostic test evaluation of the model. You need to select appropriate methods for producing the ROC curve in Azure Machine Learning Studio to compare the Two-Class Decision Forest and the Two-Class Decision Jungle modules with one another.
質問 102
ペナルティイベント検出のプロセスを定義する必要があります。
順番に実行する必要がある3つのアクションはどれですか?回答するには、適切なアクションをアクションのリストから回答エリアに移動し、正しい順序に並べます。
正解:
解説:
1 - Vary the length of frequency bands between modeling epochs
2 - Standerdize to mono audio clips.
3 - Use a Fast Fourier transform on frequancy changes over time.
質問 103
ディープラーニング仮想マシン(DLVM)を使用して、コンピューティングユニファイドデバイスアーキテクチャ(CUDA)計算を使用したディープラーニングモデルをトレーニングする予定です。
CUDAをサポートするようにDLVMを構成する必要があります。
何を実装すべきですか?
- A. グラフィックプロセッシングユニット(GPU)
- B. 高ランダムアクセスメモリ(RAM)構成
- C. Intel Software Guard Extensions(Intel SGX)テクノロジー
- D. ソリッドステートドライブ(SSD)
- E. オーバークロッキングの使用によるコンピューター処理装置(CPU)の速度の向上
正解: A
解説:
Explanation
A Deep Learning Virtual Machine is a pre-configured environment for deep learning using GPU instances.
References:
https://azuremarketplace.microsoft.com/en-au/marketplace/apps/microsoft-ads.dsvm-deep-learning
質問 104
フォルダーを参照するcsvjolderという名前のファイルデータセットを登録します。フォルダーには、AzureストレージBLOBコンテナー内の複数のコンマ区切り値(CSV)ファイルが含まれています。次のコードを使用して、ファイルデータセットからデータをロードするスクリプトを実行する予定です。次の変数を作成してインスタンス化します。
次のコードがあります。

スクリプトが参照するファイルをスクリプトが確実に読み取れるようにするには、データセットを渡す必要があります。コードコメントを置き換えるには、どのコードセグメントを挿入する必要がありますか?
A)
B)
C)
D)
- A. オプションB
- B. オプションC
- C. オプションD
- D. オプションA
正解: D
質問 105
二項分類モデルを作成します。モデルはAzureMachineLearningワークスペースに登録されています。 Azure Machine Learning Fairness SDKを使用して、モデルの公平性を評価します。
ローカルマシンでモデルのトレーニングスクリプトを開発します。
モデルの公平性メトリックをAzureMachine LearningStudioに読み込む必要があります。
あなたは何をするべきか?
- A. download_dashboard_by_upload_id関数を実装します
- B. creace_group_metric_sec関数を実装します
- C. トレーニングスクリプトをアップロードする
- D. upload_dashboard_dictionary関数を実装します
正解: D
解説:
import azureml.contrib.fairness package to perform the upload:
from azureml.contrib.fairness import upload_dashboard_dictionary, download_dashboard_by_upload_id Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-machine-learning-fairness-aml
質問 106
2,000 行を含むデータセットがあります。 Azure Learning Studio を使用して、機械学習分類モデルを構築しています。実験にパーティションとサンプル モジュールを追加します。
モジュールを構成する必要があります。次の要件を満たす必要があります。
データをサブセットに分割する
ラウンドロビン方式を使用して、行をフォールドに割り当てます
データセット内の行の再利用を許可する
モジュールをどのように構成する必要がありますか?回答するには、回答領域のダイアログ ボックスで適切なオプションを選択します。
注: 正しい選択ごとに 1 ポイントの価値があります。
正解:
解説:
References:
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/partition-and-sample
質問 107
Azure Machine Learningを使用して、モデルのトレーニングと登録を行います。
IT部門がAzure Machine Learningワークスペースで作成したservice-computeという名前の推論クラスターに、リアルタイムWebサービスとしてモデルを本番環境にデプロイする必要があります。
デプロイされたWebサービスを使用するクライアントアプリケーションは、Azure Active Directoryサービスプリンシパルに基づいて認証される必要があります。
Azure Machine Learning SDKを使用してモデルをデプロイするスクリプトを作成する必要があります。必要なモジュールがインポートされました。
どのようにコードを完成させる必要がありますか?回答するには、回答領域で適切なオプションを選択します。
正解:
解説:
質問 108
行数をrow_countという名前のメトリックとして記録する必要があります。このメトリックは、実験の実行が完了した後、Runオブジェクトのget_metricsメソッドを使用して返すことができます。どのコードを使用する必要がありますか?
- A. run.tag('row_count', rows)
- B. run.log('row_count', rows)
- C. run.log_row('row_count', rows)
- D. run.log_table('row_count', rows)
- E. run.upload_file('row_count', './data.csv')
正解: B
解説:
Log a numerical or string value to the run with the given name using log(name, value, description=''). Logging a metric to a run causes that metric to be stored in the run record in the experiment. You can log the same metric multiple times within a run, the result being considered a vector of that metric.
Example: run.log("accuracy", 0.95)
Incorrect Answers:
E: Using log_row(name, description=None, **kwargs) creates a metric with multiple columns as described in kwargs. Each named parameter generates a column with the value specified. log_row can be called once to log an arbitrary tuple, or multiple times in a loop to generate a complete table.
Example: run.log_row("Y over X", x=1, y=0.4)
Reference:
https://docs.microsoft.com/en-us/python/api/azureml-core/azureml.core.run
質問 109
Azure Machine Learning Studioを使用してバイナリ分類モデルを作成します。
モデルを評価するには、受信者動作特性(RO C)曲線とF1スコアを使用する必要があります。
必要なビジネスメトリックを作成する必要があります。
実験をどのように完了する必要がありますか?回答するには、回答領域のダイアログボックスで適切なオプションを選択します。
注:それぞれの正しい選択には1ポイントの価値があります。

正解:
解説:
質問 110
CSVファイルのセットには販売レコードが含まれています。すべてのCSVファイルは同じデータスキーマを持っています。
各CSVファイルには、特定の月の販売レコードが含まれ、ファイル名はsales.csvです。各ファイルは、データが記録された月と年を示すフォルダーに保存されます。フォルダーは、Azure MachineLearningワークスペースでデータストアが定義されているAzureBLOBコンテナー内にあります。フォルダーは、salesという名前の親フォルダーに編成され、次の階層構造を作成します。
月末に、その月のsalesファイルを含む新しいフォルダーがsalesフォルダーに追加されます。
販売データを使用して、次の要件に基づいて機械学習モデルをトレーニングすることを計画しています。
*これまでのすべての販売データを、データフレームに簡単に変換できる構造にロードするデータセットを定義する必要があります。
*特定の前月より前に作成されたデータのみを使用し、その月以降に追加されたデータを無視する実験を作成できる必要があります。
*可能な限り最小数のデータセットを登録する必要があります。
Azure MachineLearningサービスワークスペースに販売データをデータセットとして登録する必要があります。
あなたは何をするべきか?
- A. データストアを参照し、各 'sales / mm-yyyy /sales.csv'ファイルを明示的に指定する表形式のデータセットを作成します。データセットを毎月の名前で新しいバージョンとして登録し、月という名前のタグで登録した月と年を示します。このデータセットをすべての実験に使用し、に基づいて使用するバージョンを特定します。
- B. データストアを参照し、毎月各 'sales / mm-yyyy /sales.csv'ファイルを明示的に指定する新しい表形式のデータセットを作成します。毎月sales_dataset_MM-YYYYという名前のデータセットを、月と年に適切なMM値とYYYY値で登録します。実験には、適切な月固有のデータセットを使用してください。
- C. データストアを参照し、毎月各 'sales / mm-yyyy /sales.csv'ファイルを明示的に指定する表形式のデータセットを作成します。毎月sales_datasetという名前でデータセットを登録し、既存のデータセットを置き換えて、登録された月と年を示すmonthという名前のタグを指定します。このデータセットをすべての実験に使用します。
- D. データストアを参照し、パス 'sales / * / sales.csv'を指定する表形式のデータセットを作成し、sales_datasetという名前と、登録された月と年を示すmonthという名前のタグでデータセットを登録します。これを使用します。すべての実験のデータセット。
正解: D
解説:
Explanation
Specify the path.
Example:
The following code gets the workspace existing workspace and the desired datastore by name. And then passes the datastore and file locations to the path parameter to create a new TabularDataset, weather_ds.
from azureml.core import Workspace, Datastore, Dataset
datastore_name = 'your datastore name'
# get existing workspace
workspace = Workspace.from_config()
# retrieve an existing datastore in the workspace by name
datastore = Datastore.get(workspace, datastore_name)
# create a TabularDataset from 3 file paths in datastore
datastore_paths = [(datastore, 'weather/2018/11.csv'),
(datastore, 'weather/2018/12.csv'),
(datastore, 'weather/2019/*.csv')]
weather_ds = Dataset.Tabular.from_delimited_files(path=datastore_paths)
質問 111
注:この質問は、同じシナリオを提示する一連の質問の一部です。シリーズの各質問には、指定された目標を満たす可能性のある独自のソリューションが含まれています。一部の質問セットには複数の正しい解決策がある場合がありますが、他の質問セットには正しい解決策がない場合があります。
このセクションの質問に回答した後は、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
IT部門は、次のAzureリソースグループとリソースを作成します。
IT部門は、Azure Machine Learningワークスペースにaks-clusterという名前のAzure Kubernetes Service(AKS)ベースの推論コンピューティングターゲットを作成します。
GPUを搭載したMicrosoft Surface Bookコンピュータを使用しています。 Python 3.6とVisual Studio Codeがインストールされています。
ディープニューラルネットワーク(DNN)モデルをトレーニングし、損失と精度のメトリックをログに記録するスクリプトを実行する必要があります。
解決策:Azure Machine Learningワークスペースで、mlvm仮想マシンをコンピューティングターゲットとして接続します。
Azure ML SDKをSurface Bookにインストールし、Pythonコードを実行してワークスペースに接続します。 mlvmリモートコンピューティングリソースで実験としてトレーニングスクリプトを実行します。
- A. いいえ
- B. はい
正解: B
解説:
Explanation
Use the VM as a compute target.
Note: A compute target is a designated compute resource/environment where you run your training script or host your service deployment. This location may be your local machine or a cloud-based compute resource.
Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/concept-compute-target
質問 112
Azureを使用して、機械学習、実験を開発しています。
次の画像は、機械学習実験の入力と出力を示しています。
ドロップダウンメニューを使用して、グラフィックに表示される情報に基づいて各質問に回答する回答選択肢を選択します。
注:それぞれの正しい選択には1ポイントの価値があります。
正解:
解説:
質問 113
実験の実行が完了した後、Runオブジェクトのget_metricsメソッドを使用して返すことができるrow_countという名前のメトリックとして行数を記録する必要があります。どのコードを使用する必要がありますか?
- A. run.tag('row_count', rows)
- B. run.log('row_count', rows)
- C. run.log_row('row_count', rows)
- D. run.log_table('row_count', rows)
- E. run.upload_file('row_count', './data.csv')
正解: B
質問 114
Azure Machine Learning Studioで新しい実験を作成しています。多くの列に欠損値がある小さなデータセットがあります。データでは、各列に予測変数を適用する必要はありません。欠損データの処理モジュールを使用して、欠損データを処理する予定です。
データクリーニング方法を選択する必要があります。
どの方法を使用する必要がありますか?
- A. MICEを使用して交換
- B. を使用して置き換えます。確率的PCA
- C. 合成マイノリティオーバーサンプリングテクニック(SMOTE)
- D. 正規化
正解: B
解説:
Replace using Probabilistic PCA: Compared to other options, such as Multiple Imputation using Chained Equations (MICE), this option has the advantage of not requiring the application of predictors for each column. Instead, it approximates the covariance for the full dataset. Therefore, it might offer better performance for datasets that have missing values in many columns.
Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/clean-missing-data
質問 115
Azure Machine Learningをサポートするには、Azure Blob Storageにデータを保存する必要があります。
データをAzure Blob Storageに転送する必要があります。
目標を達成するための3つの可能な方法は何ですか?それぞれの正解は完全な解決策を提示します。
注:それぞれの正しい選択には1ポイントの価値があります。
- A. AzCopy
- B. Bulk Insert SQL Query
- C. Python script
- D. Bulk Copy Program (BCP)
- E. Azure Storage Explorer
正解: A,C,E
解説:
Explanation
You can move data to and from Azure Blob storage using different technologies:
Azure Storage-Explorer
AzCopy
Python
SSIS
References:
https://docs.microsoft.com/en-us/azure/machine-learning/team-data-science-process/move-azure-blob
質問 116
Azure Machine Learning Studioを使用して、マルチクラス分類を構築するデータセット10に対してフィルターベースの機能選択を実行しています。
データセットには、出力ラベル列と高度に相関するカテゴリフィーチャが含まれます。
適切なフィーチャスコアリング統計手法を選択して、主要な予測因子を識別する必要があります。どの方法を使用する必要がありますか?
- A. スピアマン相関
- B. カイ二乗
- C. ケンドール相関
- D. 人の相関
正解: D
解説:
Pearson's correlation statistic, or Pearson's correlation coefficient, is also known in statistical models as the r value. For any two variables, it returns a value that indicates the strength of the correlation Pearson's correlation coefficient is the test statistics that measures the statistical relationship, or association, between two continuous variables. It is known as the best method of measuring the association between variables of interest because it is based on the method of covariance. It gives information about the magnitude of the association, or correlation, as well as the direction of the relationship.
Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/filter-based-feature-selection
https://www.statisticssolutions.com/pearsons-correlation-coefficient/
質問 117
C-Support Vector分類を使用して、不均衡なトレーニングデータセットでマルチクラス分類を行っています。以下に示すPythonコードを使用したC-Support Vector分類:
C-Support Vector分類コードを評価する必要があります。
どの評価ステートメントを使用する必要がありますか?回答するには、回答エリアで適切なオプションを選択します。
注:それぞれの正しい選択には1ポイントの価値があります。
正解:
解説:
References:
https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html
質問 118
注:この質問は、同じシナリオを提示する一連の質問の一部です。シリーズの各質問には、記載された目標を達成する可能性のある独自のソリューションが含まれています。一部の質問セットには複数の正しい解決策がある場合もあれば、正しい解決策がない場合もあります。
このセクションの質問に回答すると、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
Azure Machine Learning Studioで新しい実験を作成しています。
1つのクラスは、トレーニングセットの他のクラスよりもはるかに少ない数の観測値を持ちます。
クラスの不均衡を補うために、適切なデータサンプリング戦略を選択する必要があります。
解決策:主成分分析(PCA)サンプリングモードを使用します。
ソリューションは目標を達成していますか?
- A. はい
- B. いいえ
正解: B
解説:
Instead use the Synthetic Minority Oversampling Technique (SMOTE) sampling mode.
Note: SMOTE is used to increase the number of underepresented cases in a dataset used for machine learning. SMOTE is a better way of increasing the number of rare cases than simply duplicating existing cases.
Incorrect Answers:
The Principal Component Analysis module in Azure Machine Learning Studio (classic) is used to reduce the dimensionality of your training data. The module analyzes your data and creates a reduced feature set that captures all the information contained in the dataset, but in a smaller number of features.
Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/smote
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/principal-component-analysis
質問 119
......
合格できるMicrosoft Azure DP-100日本語試験問題集には266問があります:https://www.goshiken.com/Microsoft/DP-100J-mondaishu.html