GoShiken DP-203日本語問題集でリアル試験問題でテストエンジン問題集でトレーニング [Q150-Q174]

Share

GoShiken DP-203日本語問題集でリアル試験問題でテストエンジン問題集でトレーニング

Microsoft DP-203日本語テスト問題集とオンライン試験エンジン

質問 # 150
Azure Synapse Analytics にエンタープライズ データ ウェアハウスを実装します。
サイズが 10 テラバイト (TB) の大きなファクト テーブルがあります。
受信クエリは、主キーの SaleKey 列を使用して、次の表に表示されるデータを取得します。

テーブルのパフォーマンスを最適化するには、大きなファクト テーブルを複数のノードに分散する必要があります。
どのテクノロジを使用する必要がありますか?

  • A. 分散レプリケートのあるヒープ テーブル
  • B. クラスター化インデックスを使用したラウンド ロビン分散テーブル
  • C. クラスター化インデックスを使用したハッシュ分散テーブル
  • D. クラスター化された列ストア インデックスを使用したラウンド ロビン分散テーブル
  • E. クラスター化された列ストア インデックスを持つハッシュ分散テーブル

正解:E

解説:
Explanation
Hash-distributed tables improve query performance on large fact tables.
Columnstore indexes can achieve up to 100x better performance on analytics and data warehousing workloads and up to 10x better data compression than traditional rowstore indexes.
Reference:
https://docs.microsoft.com/en-us/azure/sql-data-warehouse/sql-data-warehouse-tables-distribute
https://docs.microsoft.com/en-us/sql/relational-databases/indexes/columnstore-indexes-query-performance


質問 # 151
AzureSynapseにSQLプールがあります。
AzureBlobストレージからステージングテーブルにデータをロードすることを計画しています。毎日約100万行のデータが読み込まれます。テーブルは、毎日のロードの前に切り捨てられます。
ステージングテーブルを作成する必要があります。このソリューションでは、データをステージングテーブルにロードするのにかかる時間を最小限に抑える必要があります。
テーブルをどのように構成する必要がありますか?回答するには、回答領域で適切なオプションを選択します。
注:正しい選択はそれぞれ1ポイントの価値があります。

正解:

解説:

Reference:
https://docs.microsoft.com/en-us/azure/synapse-analytics/sql-data-warehouse/sql-data-warehouse-tables-partition
https://docs.microsoft.com/en-us/azure/synapse-analytics/sql-data-warehouse/sql-data-warehouse-tables-distribute


質問 # 152
Azure SynapseAnalytics専用のSQLプールでインベントリ更新テーブルを設計しています。テーブルにはクラスター化された列ストアインデックスがあり、次の列が含まれます。

次の使用パターンを特定します。
アナリストは、最も一般的に倉庫のトランザクションを分析します。
クエリは、製品カテゴリタイプ、日付、および/または在庫イベントタイプごとに要約されます。
クエリ時間を最小限に抑えるために、テーブルのパーティション戦略を推奨する必要があります。
テーブルをどの列に分割する必要がありますか?

  • A. EventDate
  • B. ProductCategoryTypeID
  • C. WarehouseID
  • D. EventTypeID

正解:C

解説:
Explanation
The number of records for each warehouse is big enough for a good partitioning.
Note: Table partitions enable you to divide your data into smaller groups of data. In most cases, table partitions are created on a date column.
When creating partitions on clustered columnstore tables, it is important to consider how many rows belong to each partition. For optimal compression and performance of clustered columnstore tables, a minimum of 1 million rows per distribution and partition is needed. Before partitions are created, dedicated SQL pool already divides each table into 60 distributed databases.


質問 # 153
ある企業は、製造機械を監視するために IoT デバイスを購入します。同社は IoT アプライアンスを使用して IoT デバイスと通信します。
企業は、デバイスをリアルタイムで監視できなければなりません。
ソリューションを設計する必要があります。
何をお勧めしますか?

  • A. Azure PowerShell を使用した Azure Analysis Services
  • B. Azure Portal を使用した Azure Analysis Services
  • C. Azure PowerShell を使用した Azure Stream Analytics クラウド ジョブ
  • D. Azure Portal を使用した Azure Data Factory インスタンス

正解:C

解説:
Stream Analytics is a cost-effective event processing engine that helps uncover real-time insights from devices, sensors, infrastructure, applications and data quickly and easily.
Monitor and manage Stream Analytics resources with Azure PowerShell cmdlets and powershell scripting that execute basic Stream Analytics tasks.
Reference:
https://cloudblogs.microsoft.com/sqlserver/2014/10/29/microsoft-adds-iot-streaming-analytics-data-production-and-workflow-services-to-azure/


質問 # 154
Azure Data Lake Storage Gen2 コンテナーにファイルを保存します。コンテナは、次の図に示す保管方針を持っています。

ドロップダウン メニューを使用して、グラフィックに表示されている情報に基づいて各ステートメントを完了する回答の選択肢を選択します。
注: 正しい選択ごとに 1 ポイントの価値があります。

正解:

解説:

Reference:
https://docs.microsoft.com/en-us/dotnet/api/microsoft.azure.management.storage.fluent.models.managementpolicybaseblob.tiertocool


質問 # 155
Azure DataFactoryパイプラインにアクティビティがあります。このアクティビティは、Azure Synapse Analyticsのデータウェアハウスにあるストアドプロシージャを呼び出し、毎日実行されます。
アクティビティが最後に実行されたときのアクティビティの期間を確認する必要があります。
何を使うべきですか?

  • A. Azure SynapseAnalyticsのアクティビティログ
  • B. アクティビティはAzureMonitorで実行されます
  • C. Azure SynapseAnalyticsのsys.dm_pdw_wait_statsデータ管理ビュー
  • D. Azure ResourceManagerテンプレート

正解:B

解説:
Reference:
https://docs.microsoft.com/en-us/azure/data-factory/monitor-visually


質問 # 156
Azure Data Lake Storage Gen2 のデプロイを計画しています。
データレイクにアクセスする次の 2 つのレポートがあります。
Report1: 50 列を含むファイルから 3 つの列を読み取ります。
Report2: タイムスタンプに基づいて単一のレコードをクエリします。
レポートをサポートするには、データ レイクにデータを保存する形式を推奨する必要があります。ソリューションは、読み取り時間を最小限に抑える必要があります。
各レポートで何を推奨しますか?答えるには、答えで適切なオプションを選択します。
注: 正しい選択ごとに 1 ポイントの価値があります。

正解:

解説:

Reference:
https://streamsets.com/documentation/datacollector/latest/help/datacollector/UserGuide/Destinations/ADLS-G2-D.html


質問 # 157
2020年上半期のトランザクションのファクトテーブルを含むAzureSynapseAnalytics専用のSQLプールを構築しています。
テーブルが次の要件を満たしていることを確認する必要があります。
10年より古いデータを削除するための処理時間を最小限に抑えます年から現在までの値を使用するクエリのI / Oを最小限に抑えますTransact-SQLステートメントをどのように完了する必要がありますか。回答するには、回答領域で適切なオプションを選択します。
注:正しい選択はそれぞれ1ポイントの価値があります。

正解:

解説:

Reference:
https://docs.microsoft.com/en-us/sql/t-sql/statements/create-partition-function-transact-sql


質問 # 158
仮想ネットワーク サービス エンドポイントが構成されている Azure Data Lake Storage アカウントがあります。
Azure Data Factory を使用して、Data Lake Storage アカウントからデータを抽出する予定です。その後、データは、PolyBase を使用して Azure Synapse Analytics のデータ ウェアハウスに読み込まれます。
Data Lake Storage にアクセスするには、どの認証方法を使用する必要がありますか?

  • A. 共有アクセスキー認証
  • B. マネージド ID 認証
  • C. アカウントキー認証
  • D. サービス プリンシパル認証

正解:B

解説:
Reference:
https://docs.microsoft.com/en-us/azure/data-factory/connector-azure-sql-data-warehouse#use-polybase-to-load-d


質問 # 159
毎日 200,000 個の新しいファイルを生成する Azure ストレージ アカウントを持っています。ファイル名の形式は、(YYY)/(MM)/(DD)/|HH])/(CustornerID).csv です。
新しいデータをストレージ アカウントから Azure Data Lake に 1 時間ごとに読み込む Azure Data Factory ソリューションを設計する必要があります。ソリューションでは、読み込み時間とコストを最小限に抑える必要があります。
ソリューションをどのように構成すればよいでしょうか? 回答するには、回答領域で適切なオプションを選択してください。
注: 正しく選択するたびに 1 ポイントの価値があります。

正解:

解説:


質問 # 160
Azureサブスクリプションがあります。
ステージングテーブルを含むpool1という名前のAzureSynapseAnalytics専用SQLプールにデータウェアハウスを構築することを計画しており、ディメンションモデルPool1には次のテーブルが含まれます。

正解:

解説:


質問 # 161
次の Azure Stream Analytics クエリがあります。

次の各ステートメントについて、ステートメントが true の場合は [はい] を選択します。それ以外の場合は、[いいえ] を選択します。
注: 正しい選択ごとに 1 ポイントの価値があります。

正解:

解説:

Explanation

Box 1: Yes
You can now use a new extension of Azure Stream Analytics SQL to specify the number of partitions of a stream when reshuffling the data.
The outcome is a stream that has the same partition scheme. Please see below for an example:
WITH step1 AS (SELECT * FROM [input1] PARTITION BY DeviceID INTO 10),
step2 AS (SELECT * FROM [input2] PARTITION BY DeviceID INTO 10)
SELECT * INTO [output] FROM step1 PARTITION BY DeviceID UNION step2 PARTITION BY DeviceID Note: The new extension of Azure Stream Analytics SQL includes a keyword INTO that allows you to specify the number of partitions for a stream when performing reshuffling using a PARTITION BY statement.
Box 2: Yes
When joining two streams of data explicitly repartitioned, these streams must have the same partition key and partition count.
Box 3: Yes
10 partitions x six SUs = 60 SUs is fine.
Note: Remember, Streaming Unit (SU) count, which is the unit of scale for Azure Stream Analytics, must be adjusted so the number of physical resources available to the job can fit the partitioned flow. In general, six SUs is a good number to assign to each partition. In case there are insufficient resources assigned to the job, the system will only apply the repartition if it benefits the job.
Reference:
https://azure.microsoft.com/en-in/blog/maximize-throughput-with-repartitioning-in-azure-stream-analytics/


質問 # 162
Azure Data Lake Storage Gen2 コンテナーがあります。
データはコンテナーに取り込まれ、データ統合アプリケーションによって変換されます。その後、データは変更されません。ユーザーはコンテナー内のファイルを読み取ることができますが、ファイルを変更することはできません。
次の要件を満たすデータ アーカイブ ソリューションを設計する必要があります。
新しいデータは頻繁にアクセスされ、できるだけ早く利用できるようにする必要があります。
5 年以上前のデータにアクセスする頻度は低くなりますが、要求されたときに 1 秒以内に利用できるようにする必要があります。
7 年以上前のデータにはアクセスしません。 7 年後、データは可能な限り低いコストで永続化する必要があります。
必要な可用性を維持しながら、コストを最小限に抑える必要があります。
データをどのように管理する必要がありますか?答えるには、答えで適切なオプションを選択します。
注: 正しい選択ごとに 1 ポイントの価値があります。

正解:

解説:

Reference:
https://docs.microsoft.com/en-us/azure/storage/blobs/storage-blob-storage-tiers
https://azure.microsoft.com/en-us/updates/reduce-data-movement-and-make-your-queries-more-efficient-with-the-general-availability-of-replicated-tables/
https://azure.microsoft.com/en-us/blog/replicated-tables-now-generally-available-in-azure-sql-data-warehouse/


質問 # 163
SQLPool1 という名前の Azure Synapse Analytics 専用 SQL プールを含む Azure サブスクリプションがあります。
SQLPool1 は現在一時停止しています。
SQLPool1 の現在の状態を新しい SQL プールに復元する必要があります。
最初に何をすべきですか?

  • A. 新しい SQL プールを作成します。
  • B. ユーザー定義の復元ポイントを作成します。
  • C. SQLPool1 を再開します。
  • D. ワークスペースを作成します。

正解:B

解説:
Reference:
https://docs.microsoft.com/en-us/azure/synapse-analytics/sql-data-warehouse/sql-data-warehouse-restore-active-paused-dw


質問 # 164
Microsoft Visual Studio の Stream Analytics プロジェクト ソリューションである Azure Stream Analytics ジョブがあります。ジョブは、JSON 形式で IoT デバイスによって生成されたデータを受け入れます。
IoT デバイスによって生成されたデータを Protobuf 形式で受け入れるようにジョブを変更する必要があります。
Visual Studio から順番に実行する必要がある 3 つのアクションはどれですか?回答するには、アクションのリストから適切なアクションを回答エリアに移動し、正しい順序で並べてください。

正解:

解説:

Reference:
https://docs.microsoft.com/en-us/azure/stream-analytics/custom-deserializer


質問 # 165
FlightとWeatherという名前の2つのファクトテーブルがあります。テーブルを対象とするクエリは、次の列間の結合に基づいて行われます。

クエリのパフォーマンスを最大化するソリューションを推奨する必要があります。
推奨事項には何を含める必要がありますか?

  • A. 各テーブルにIDENTITY列を作成します。
  • B. テーブルで、ArriveAirPortIDとAirportIDのハッシュ分布を使用します。
  • C. テーブルで、ArriveDateTimeとReportDateTimeのハッシュ分布を使用します。
  • D. 各テーブルで、テーブル内の他の2つの列の複合として列を作成します。

正解:B


質問 # 166
Azure Active Directory(Azure AD)統合を使用して、Azure Data Lake StorageGen2に自動的に接続するAzureDatabricksクラスターを実装する必要があります。新しいクラッターをどのように構成する必要がありますか?答えるには、答えの中から適切なオプションを選択してください。注:正しい選択はそれぞれ1ポイントの価値があります。

正解:

解説:

Explanation

https://docs.azuredatabricks.net/spark/latest/data-sources/azure/adls-passthrough.html


質問 # 167
16 個のパーティションを持つ、retailhub という名前の Azure イベント ハブがあります。トランザクションは Retailhub に転記されます。各トランザクションには、トランザクション ID、個々の項目、および支払いの詳細が含まれます。トランザクション ID は、パーティション キーとして使用されます。
あなたは、小売店での不正の可能性があるトランザクションを特定するための Azure Stream Analytics ジョブを設計しています。ジョブは、retailhub を入力として使用します。このジョブは、トランザクション ID、個々の項目、支払いの詳細、不正スコア、および不正インジケータを出力します。
出力を、fairhub という名前の Azure イベント ハブに送信する予定です。
不正検出ソリューションが高度にスケーラブルであり、トランザクションを可能な限り迅速に処理することを確認する必要があります。
Stream Analytics ジョブの出力をどのように構造化する必要がありますか?回答するには、回答エリアで適切なオプションを選択してください。
注: 正しい選択ごとに 1 ポイントの価値があります。

正解:

解説:

Reference:
https://docs.microsoft.com/en-us/azure/event-hubs/event-hubs-features#partitions


質問 # 168
デバイスからのイベントデータを処理するためのAzureStreamAnalyticsソリューションを実装しています。
デバイスは、障害が発生するとイベントを出力し、障害が解決されるまで5秒ごとにイベントを繰り返し発行します。障害が存在しない場合、デバイスは前のイベントの後に5秒ごとにハートビートイベントを出力します。
次の表に、イベントのサンプルを示します。

障害間の稼働時間を計算する必要があります。
Stream Analytics SQLクエリをどのように完了する必要がありますか?答えるには、答えの中から適切なオプションを選択してください。
注:正しい選択はそれぞれ1ポイントの価値があります。

正解:

解説:

Reference:
https://docs.microsoft.com/en-us/stream-analytics-query/session-window-azure-stream-analytics
https://docs.microsoft.com/en-us/stream-analytics-query/tumbling-window-azure-stream-analytics


質問 # 169
AzureDataFactoryに自己ホスト型の統合ランタイムがあります。
統合ランタイムの現在のステータスには、以下の構成があります。
ステータス:実行中
タイプ:セルフホスト
実行中/登録済みノード:1/1
高可用性の有効化:False
リンクされたカウント:0
キューの長さ:0
平均キュー期間。0.00秒
統合ランタイムには、次のノードの詳細があります。
名前:XM
ステータス:実行中
使用可能なメモリ:7697MB
CPU使用率:6%
ネットワーク(イン/アウト):1.21KBps / 0.83KBps
並行ジョブ(実行/制限):2/14
役割:ディスパッチャー/ワーカー
クレデンシャルステータス:同期中
ドロップダウンメニューを使用して、提示された情報に基づいて各ステートメントを完了する回答の選択肢を選択します。
注:正しい選択はそれぞれ1ポイントの価値があります。

正解:

解説:

Reference:
https://docs.microsoft.com/en-us/azure/data-factory/create-self-hosted-integration-runtime


質問 # 170
Azure SynapseAnalytics専用のSQLプールにテーブルを作成することを計画しています。
表のデータは5年間保持されます。年に一度、5年以上前のデータは削除されます。
データがパーティション間で均等に分散されていることを確認する必要があります。ソリューションでは、古いデータの削除に必要な時間を最小限に抑える必要があります。
Transact-SQLステートメントをどのように完了する必要がありますか?答えるには、適切な値を正しいターゲットにドラッグします。各値は、1回使用することも、複数回使用することも、まったく使用しないこともできます。コンテンツを表示するには、ペイン間で分割バーをドラッグするか、スクロールする必要がある場合があります。
注:正しい選択はそれぞれ1ポイントの価値があります。

正解:

解説:

Reference:
https://docs.microsoft.com/en-us/sql/t-sql/statements/create-table-azure-sql-data-warehouse
https://docs.microsoft.com/en-us/azure/synapse-analytics/sql/best-practices-dedicated-sql-pool


質問 # 171
Azure Stream Analytics ジョブがあります。
ジョブに十分なストリーミング ユニットがプロビジョニングされていることを確認する必要があります。
SU % 使用率メト​​リックの監視を構成します。
監視する必要がある追加の指標を 2 つ選択してください。各正解は、ソリューションの一部を示しています。
注: それぞれの正しい選択は 1 ポイントの価値があります。

  • A. 遅延入力イベント
  • B. 順不同のイベント
  • C. 透かし遅延
  • D. バックログ入力イベント
  • E. 関数イベント

正解:C、D

解説:
To react to increased workloads and increase streaming units, consider setting an alert of 80% on the SU Utilization metric. Also, you can use watermark delay and backlogged events metrics to see if there is an impact.
Note: Backlogged Input Events: Number of input events that are backlogged. A non-zero value for this metric implies that your job isn't able to keep up with the number of incoming events. If this value is slowly increasing or consistently non-zero, you should scale out your job, by increasing the SUs.
Reference:
https://docs.microsoft.com/en-us/azure/stream-analytics/stream-analytics-monitoring


質問 # 172
Azure IoT Hub から入力データを受け取り、結果を Azure Blob Storage に書き込む Azure Analytics クエリを構築しています。
1 時間あたりのセンサーごとの読み取り値の差を計算する必要があります。
どのようにクエリを完成させますか?答えるには、答えで適切なオプションを選択します。
注: 正しい選択ごとに 1 ポイントの価値があります。

正解:

解説:

Reference:
https://docs.microsoft.com/en-us/stream-analytics-query/lag-azure-stream-analytics


質問 # 173
ゲームデータを取得するためのAzureStreamAnalyticsジョブを構築しています。
各ゲームの5分間隔ごとに、ジョブが最高スコアのレコードを返すようにする必要があります。
Stream Analyticsクエリをどのように完了する必要がありますか?答えるには、答えの中から適切なオプションを選択してください。
注:正しい選択はそれぞれ1ポイントの価値があります。

正解:

解説:

Reference:
https://docs.microsoft.com/en-us/stream-analytics-query/topone-azure-stream-analytics
https://docs.microsoft.com/en-us/azure/stream-analytics/stream-analytics-window-functions


質問 # 174
......

Microsoft DP-203日本語問題を提供していますMicrosoft Certified: Azure Data Engineer Associate問題集と完璧な解答付き:https://www.goshiken.com/Microsoft/DP-203J-mondaishu.html