車両運行データ分析(車両運行軌跡に基づくビッグデータ分析と活用)

車両運行データ分析(車両運行軌跡に基づくビッグデータ分析と活用)

車両運行軌跡に基づくビッグデータ分析と応用

時代の進歩に伴い、物流業界の急速な発展により貨物の需要が増加し、貨物の移動データを記録するのに人力だけに頼るには時間コストが高くなります。

空間測位技術と無線技術が進歩し普及するにつれ、測位とナビゲーション用の GPS デバイスが搭載される貨物トラックが増えています。 GPS 装置を通じて大量の車両軌跡データが収集され、その中には大量の車両運行情報が含まれています。データマイニング技術を用いて軌跡データから有効な情報を抽出することは、近年難しい研究課題となっている。

データマイニングとは、膨大なノイズの多い生データから有効な情報を取得するデータ処理方法を指します。軌跡データは幅広い用途に利用できます。たとえば、履歴データを使用して現在の軌道の位置を予測できます。

このデータを使用して、さまざまな時間帯の都市の交通状況を監視することができます。都市内の貨物量は車両軌跡データを通じて分析できます。人々の移動パターンを分析し、それに応じて移動ルートを推奨するなどが可能になります。

物流輸送の過程において、運転手による商品の盗難や私物輸送などの異常行為の検出が物流業界の大きな問題となっています。そこで本論文では、車両の異常動作検出の問題について検討する。

従来の異常動作検出の問題はすべて車両の軌道異常に基づいており、既存の軌道異常検出アルゴリズムのほとんどは、短距離の単一移動のタクシーを対象としています。

しかし、大型トラックは一般的にルートが長くて複雑なため、異常な軌跡の検出が難しく、精度も低くなります。

そのため、一部の学者は、まず軌道を多数のサブ軌道に分割し、その後異常検出を実行することを選択します。しかし、これらの方法には不合理な点も数多くあります。例えば、大型トラックは長距離を走行するため、運転手によって慣れているルートが異なる場合があり、たとえ軌跡が異なっていても、必ずしも車両の挙動が異常であるとは限りません。

一般的に、軌道は速度しきい値と運転方向の変更を使用してサブ軌道に分割されます。しかし、すべての車両によって取得されたサブ軌跡の開始点と終了点は必ずしも同じではないため、異常検出が非常に困難になり、検出結果に大きな誤差が生じます。

頻繁に通行される経路で異常な行動が発生した場合、従来の方法ではそれを特定することが困難です。研究により、異常な車両動作は異常な駐車を通じて現れる可能性があることがわかっています。

そこで本稿では、主に2つの部分からなるトラック軌跡ビッグデータに基づいて、異常な積み下ろし(出発地と目的地、OD)ポイントを識別する方法を提案する。

まず、軌跡点からOD ポイントを識別し、次に OD ポイントから異常検出を実行します。このようにして、異常軌跡認識問題を異常ODポイント認識問題に変換することができ、上記の不合理な側面を回避できます。

外れ値を識別する方法は、分類やクラスタリングに基づくものなど多数ありますが、いずれも正常な特性に従わないデータを異常として識別します。

分離フォレスト アルゴリズムは、異常データの定量的属性 (つまり、外れ値が少なく、その属性値が正常なインスタンスの属性値と大きく異なる) を使用して外れ値を識別します。高精度、高効率という利点があり、ビッグデータにおける外れ値識別の問題に適しています。

iForest は、決定木やランダム フォレストに似ており、分離されたツリー (iTree) で構成されています。ただし、距離と密度を計算する必要がないため、線形の時間計算量のみになります。したがって、本論文では、異常な OD ポイントを検出するために iForest を活用します。

iForest の異常検出は 2 つの段階で構成されます。最初の段階では、トレーニング セットのサンプルを使用して、 t 本の孤立したツリーを含む孤立フォレストを構築します。第2段階では、分離フォレストを使用して各インスタンスの異常スコアを取得し、異常を識別します

iForest のパラメーター α は外れ値の割合です。実験では、α=0.03のときに検出効果が最も高くなることが示されています。下の図は異常ODポイントの識別を示しています。図からわかるように、これらの車両は基本的に包頭・天津路線の貨物輸送に従事している。

図中の各点はトラックの OD ポイントを表しており、合計で 1796 個あります。このうち、青い点は正常な OD ポイントを表し、赤い点は異常な OD ポイントを表します。異常点の検出結果を下図に示します。

ヤンは2009年にカッコウアルゴリズムを提案した際に、特定の問題に対してアルゴリズムのパラメータを微調整する必要はないと指摘しましたが、カッコウアルゴリズムは他のメタヒューリスティックアルゴリズムよりも汎用性が高く堅牢です。

しかし、その後の文献のほとんどは、アルゴリズムの改善においてパラメータを調整し、パラメータの調整によってアルゴリズムの収束速度が変わる可能性があることを実験を通じて確認しています。

さらに、多くの文献では、カッコウアルゴリズムを他のメタヒューリスティック手法と組み合わせることで、カッコウアルゴリズムの検索効率が向上し、検索収束速度が向上し、局所最適解に陥ることを回避できることが確認されています。

ランダム探索のメタヒューリスティックアルゴリズムでは、探索能力と活用能力のバランスをどのように実現するかが、常に探求する価値のある問題です。

同時に、上記文献の分析から、カッコウアルゴリズムの欠点は、レヴィフライトにおけるランダム分布のヘビーテール特性により確率的な意味での大域的探索を保証できるものの、情報共有メカニズムの導入により収束速度が加速する一方で、局所最適解に陥りやすくなることであることがわかります。

さまざまな単一種のカッコウアルゴリズムの改良の中で、関連するグローバル検索戦略とローカル検索戦略を改良したものが多く、非常に複雑になり、その一部はますます理解しにくくなっています。

したがって、比較的単純でありながら、探索能力と開発能力のバランスをうまくとれるアルゴリズムを設計する必要があり、このメカニズムは識別と設計も容易です。

確率的システム結合は、グループ化が CS アルゴリズムのパフォーマンスの向上に役立つことを示しています。島モデルとカッコウアルゴリズムを組み合わせた実験結果からも、個体群分割法によってアルゴリズムのパフォーマンスを向上できることが証明されています。

したがって、アルゴリズムの設計では、アイランド モデルを参照して、2 つの集団に異なる検索戦略で検索させることができますが、2 つの集団の検索戦略には異なる重点があります。

集団 1 はグローバル検索に重点を置いており、集団 2 はローカル検索に重点を置いています。同時に、2 つの集団間で情報を共有するための特定の戦略が選択されます。

このことから、2 つの集団の最適解を最悪の解と交換して置き換えても、探索能力は低下せず、世代間の最適解を中心とした開発能力が向上することがわかります。

したがって、2 つの集団が一定数の世代にわたって独立して実行された後に、ソリューションを交換して置き換えることを選択する必要があります。各集団における探索戦略の選択はそれぞれの優先順位に基づくべきであり、サブ集団におけるアルゴリズムパラメータの設計は複雑である必要はない

一方、初期集団の状況もアルゴリズムのパフォーマンスに影響します。集団の多様性が高ければ高いほど局所最適解に陥る可能性は低くなります

カオス運動には一定の不確実性、エルゴード性、ランダム性があり、一定の範囲内で均等に分布することができます。

そのため、ますます多くの研究者がカオスエルゴード性の特性を利用してヒューリスティック最適化アルゴリズムのランダム性を低減し、特に初期集団の生成に適用して、初期集団の多様性を十分に確保しています。

上記の分析に基づいて、本論文では二重集団に基づくカッコウ検索アルゴリズムを提案する。

アルゴリズムの有効性を検証するために、シミュレーション実験比較分析のためにいくつかの異なるタイプのテスト関数と複数のアルゴリズムが選択されました。実験結果は、DPCS がアルゴリズムの最適化精度を向上させ、改善されたアルゴリズムの優位性を検証できることを示しています。

改良されたアイデアに基づいて、CS アルゴリズムは次のように改良されます。まず、集団はテント カオス マッピングで初期化され、非線形に減少する適応ステップ サイズ係数が提案されます。

第二に、粒子群アルゴリズムは、アルゴリズムの位置更新方法を改善するために使用される(
粒子カッコウ探索アルゴリズム(PCS)。

最後に、二重人口戦略が提案されます。集団 1 は検索範囲を拡大し、アルゴリズムの開発能力を向上させますが、もう 1 つの集団は、探索能力を高めるために局所最適解の周りの検索に重点を置いています。そして、集団が一定回数反復されると、情報共有が行われ、アルゴリズムの収束精度が向上します。

時代の発展とともに、物流業界も急速な発展を遂げ、貨物配送の需要は徐々に増加してきました。そのため、物流会社にとって最適な貨物配送ルートを見つけ、配送コストを削減することが重要です

物流業界における貨物配送問題は、複数の配送ルートから最適な計画を見つけ、貨物配送の効率を向上させることを目的としています。初心者は、この問題を解決するためにさまざまな正確なアルゴリズムを使用します。

しかし、実際の問題がますます複雑になるにつれて、このようなアルゴリズムの最適化効果は理想的ではなくなります。より多くのヒューリスティック アルゴリズムが出現するにつれて、多くの学者が急速に発展するインテリジェント アルゴリズムを採用して、経路計画における近似最適解を見つけています。

現在、ルート計画の問題を解決するためにインテリジェントな最適化アルゴリズムを使用することで、優れた最適化結果が得られています。同時に、カッコウ探索アルゴリズムは経路計画問題の解決にも効果を発揮しました。

そこで本論文では、CSアルゴリズムに基づいて改良したDPCSアルゴリズムを商品配送の経路計画問題に適用し、生活上の実際的な問題を用いてアルゴリズムの実現可能性を検出する

CS、PSO、PCS、DPCS アルゴリズムを使用した経路計画問題に関する比較実験が行われます。改良されたアルゴリズムの実現可能性は、実験結果を通じてより包括的に検証できます。実験に使用した配送拠点は、第2章で特定したある企業の実際の荷役拠点20か所です。配送拠点の住所と経度・緯度の座標データは表に示されています。

実験中、アルゴリズムの母集団サイズは n=20、最大反復回数は 1500maxt であり、上記の 4 つのアルゴリズムはそれぞれ独立して 20 回実行されました。

各アルゴリズムの平均値、最短経路、最適経路が記録されます。実験結果を表に示します。太字のデータは最適解であり、最適な経路計画が表示されています。赤い点は配達ポイント、青い線はアクセス ルート、赤い線は開始配達ポイントと最終配達ポイントを接続します。

経度と緯度の2つの座標間の距離は緯度に関係するため、2次元の座標軸で表示すると大きな偏差が生じるため、実際の地図上で視覚化されます。

実験結果の表と図から、PCS は CS や PSO よりもある程度優れていることがわかります。これは、粒子群の考えに基づく改良戦略により、CS アルゴリズムの解決精度をさらに向上できることが証明されています。

DPCS アルゴリズムはデュアル ポピュレーション戦略を採用しており、アルゴリズムの収束速度と精度が大幅に向上します。したがって、計画されたパスの長さは他の 3 つのアルゴリズムよりもはるかに短くなります

PSO アルゴリズムによって計画された最適パスと比較すると、距離が 3 分の 1 近く短縮され、不要な迂回が大幅に削減されます。要約すると、DPCS アルゴリズムは、パス計画問題でも優れた最適化パフォーマンスを発揮します。

大型トラックの軌跡データに基づいて異常ODポイントを識別する方法を提案する。従来の方法とは異なり、パス全体がオブジェクトとして分析されます。

本論文では、離散的思考を用いて、まず軌跡点をクラスタリングして有効なOD点を特定し、次に分離フォレストアルゴリズムを使用して異常なOD点を特定し、最後に宝鋼集団の車両軌跡データを用いて実証分析を実施します。結果は、この方法が異常な OD ポイントを効果的に識別できることを示しています。

デュアルポピュレーション戦略に基づく改良された DPCS アルゴリズム。まず、カオスマッピングのランダム性とエルゴード性のため、テントカオスマッピングを使用して集団を初期化し、初期集団が解空間内に均等に分散されるようにします

第二に、ステップ係数のサイズは、Levy フライトの結果に影響を与える可能性があります。本論文では、固定ステップ係数の代わりに非線形に減少する適応ステップ係数を提案し、これによりアルゴリズムの検索ステップサイズが初期段階で大きくなり、グローバル検索に重点が置かれるため、収束速度が加速されます。

検索の後の段階では、検索が最適解に近づくと、ステップ サイズが小さくなり、ローカル検索に重点が置かれるため、検索の精度が向上します。次に、 PSO アルゴリズムの自己学習と社会学習のアイデアを使用して、個々の位置更新式を改善します。

最終的に、二重人口戦略が採用されます。集団 1 は PSO アルゴリズムを利用してローカル検索に重点を置き、集団 2 は CS アルゴリズムを利用してグローバル検索に重点を置きます。これにより、改善されたアルゴリズムによって探索能力と開発能力のバランスがより良く保たれます。

2 つの集団が 1 サイクル反復する場合、集団を交換して集団内の不良なソリューションを排除し、他の集団のより良いソリューションを吸収します。これにより、アルゴリズムの収束速度と検索精度が効果的に向上します。

<<:  スーパーマーケット運営データ分析(スーパーマーケット顧客流動統計分析システム運用データの収集・分析)

>>:  業務分析データフォーム(ゼネラルマネージャーとディレクターの2018年の企業業務効率、構造、リスクの要約と分析フォームのフルセット)

推薦する

企業の経営方針とその内容(浙江商業銀行:12文字の経営方針、新たな高品質成長の柱)

浙江商業銀行:12のビジネス政策、新たな高品質成長の柱目覚ましい回復を遂げたこの年、中国浙商銀行は再...

WordPress 脆弱性スキャン セキュリティ プラグインの推奨

ウェブサイトの脆弱性はハッカーの攻撃につながる可能性があり、ハッカーがアクセスすると、顧客データやそ...

Amazon S3 バケットの権限設定

Amazon S3 は、個人や業界の大量のデータを保存および保護するために Amazon Web S...

ケータリング業界におけるブランドプランニング(ケータリングブランドの紹介文の書き方)

レストランのブランド紹介文はどのように書けばいいですか?ケータリング業界は、さまざまなブランドが次々...

ビッグデータセンター運営(貴陽:彭勝志がビッグデータセンターの運営と管理を調査)

貴陽:彭勝志がビッグデータセンターの運営と管理を調査調査サイト。レッドネットタイム5月12日(邱龍飛...

製品プロモーション戦略(顧客を引き付け、売上を伸ばす12の戦略)

顧客を引き付けて売上を伸ばす12の戦略営業担当者として、より多くの顧客を引き付けて製品を購入してもら...

商品企画・ブランド企画(新ブランド創出に向けたリサーチ・企画)

新ブランド創出に向けた調査・企画目次1. 市場調査 - ターゲット市場と競合他社を理解する。 3. ...

WeChat 小型店舗の宣伝方法 (WeChat 小型プログラム モールの作り方)

WeChatミニプログラムモールを作成するには?現在、モバイルインターネットの急速な発展に伴い、W...

農業資材ブランドマーケティング(農業資材販売:店舗イメージから顧客体験まで、販売戦略を総合的に改善!)

農業用品販売:店舗イメージから顧客体験まで、販売戦略を総合的に改善します! 1. プロフェッショナ...

ガソリンスタンド運営データ(民間ガソリンスタンドのデータ解釈:何軒あるのか?どこにあるのか?どうやって儲けているのか?)

民間ガソリンスタンドのデータ分析:いくつあるか?どこ?どうやってお金を稼ぐのか?中国は世界最大の自...

CAデジタル証明書とは何ですか? CAデジタル証明書の申請方法

CA デジタル証明書とは何ですか? CA デジタル証明書とは、一般的に、信頼できる CA 組織によっ...

華山ブランドマーケティング30講義(18)

18 18 |信号エネルギーの原理: ブランドを長持ちさせるにはどうすればよいでしょうか?こんにち...

ウェブサイトの最適化における擬似静的の重要性

動的ウェブサイトが普及して以来、疑似静的ウェブサイトは珍しいものではなくなりました。疑似静的 (ew...

CentOSにRubyをインストールする方法 CentOSにRubyをインストールする方法の紹介

Ruby は、シンプルさと使いやすさを念頭に置いて作成された、動的でオープンソースのオブジェクト指向...

WeChatビジネスの受動的な流出(最新のWeChatビジネスファン誘致技術は、1日で300人以上のBaomaファンを受動的に誘致することができます)

最新のマイクロビジネスファン誘致技術により、1日で300人以上の母親ファンを受動的に誘致WeChat...