空間パターン分析

データの強化が重要です。ビジネスと教育のコラボレーション

位置データを初めて地図に追加して視覚化する際に、何が期待できますか?私たちの目標は、空間パターンがあるかどうかを発見することだと確信しています:フィーチャの強度が高い領域と低い領域、クラスターと外れ値、共通の方向、不規則な軌道、値が高い領域と低い領域など。特徴の重要性を判断し、予測モデルを構築し、データサイエンティストに電話する準備ができているパターンを探索します。

パターンを発見するために使用されるアプローチは、別の記事に値します。現在、私はそれに取り組んでおり、タイトル「ヒートマップの使用をやめる...」から始めようとしています。したがって、研究者がパターン分析アルゴリズムを認識しており、GISの世界に深く入り込む準備ができていると想像してください。

この記事では、ポイントパターン分析について説明し、パターン分析アルゴリズムの結果と非GIS専門家が直面する問題を示し、現在のソフトウェアの不備に対するソリューションの開発におけるビジネスと科学のコラボレーションについて説明します。

ポイントパターン分析。強度クラスターと外れ値

簡単ですが、現実世界のケースから始めましょう。研究者は、都市(公園のあらゆる場所のデータ)の盗難の場所(自動車事故、緊急通報、ツイート、写真、鳥の巣、またはビーバーのロッジ)を入手しました。 、海、国…何であれ)。研究者の仕事は、空間パターンがあるかどうかを調査し、ある場合はそれらを区別することです。ランダム性を回避するために、特定のセルサイズを使用して分布領域にグリッドを構築しました。次のステップで、研究者はすべてのセル内のフィーチャの数をカウントし、実際にタスクに応じてクラスターと外れ値分析および/またはホットスポットとコールドスポット分析を実行します。

さらに、彼または彼女はNNAおよびQuadrat Analysisを実行したため、研究者はオブジェクトがクラスター化された分布を持ち、結果がこれらのクラスターと異常値を示すことをほぼ確信しています。

盗難パターン分析。 Aspectumのスクリーンショット

研究者は結果にかなり満足していると思います。外れ値の探索を開始するのに十分ですが、高い値と低い値のクラスターで覆われた領域はめちゃくちゃ広大です。都市を知っている人にとっては、価値の高いクラスターは明白に見えます。これらは住宅地とビジネスエリアです。値の低いクラスター(青の部分)は、森林、川、および工業地帯に対応しています。

この時点で、クラスター化されたエリアのより正確な結果を得るために、研究者はデータを分析する際に都市のクラスを考慮することを決定します。同様の地域内のクラスターを見つけるのに役立つ場合があります。緑地や水域とは別に住宅地内の特徴分布を比較します。

そのため、研究者がAspectumを使用せず、GIS関連のすべての問題に直面したと想像してください:シェープファイル、投影、不器用なデスクトップソフトウェア、分布ベクトルデータの領域、グリッドサイズの式、プラグインまたは個別の拡張機能による適切なアルゴリズム(ところで、 Aspectumを使用するのは、生データに関するものです)。

今、彼または彼女は都市の土地分類ベクトルデータセットを構築する必要があります。しかし、どのように?データはどこにありますか?どのゾーンを区別する必要がありますか?このゾーンを分類するパラメーターは何ですか?さらなるタスクのためにこれを自動化する方法は?

プロジェクト。ビジネスと教育が豊かになるとき

ソフトウェア開発会社の仕事は、対象読者に仕事を教える必要なく価値ある結果を生み出すことができる製品を提供することだと考えています。また、GISの場合、通常6年間の高校の勉強が必要です。

Aspectumは、世界のすべての集落について都市の土地利用データを生成するプロジェクトを開始することを決定しました。このような野心的な目標は、Rivne Noosphere Engineering Schoolの友人やパートナーにとって興味深いものになりました。ソフトウェア工学、GIS、都市研究のバックグラウンド、そして何よりもまず、情熱を持った学生のチームは講師の監督の下で組織されました。

タスクには正しいアプローチがないため、反復して開発を開始し、結果を絶えず確認して議論しました。この記事では、プロジェクトの実装の核となるアイデアを紹介し、テストで利用できるようになった結果を示します。

次の記事では、テスト済みのアプローチ、機能しなかった結果、改善のアイデア、および実装された補足機能を共有します。

コンセプト

地理空間データを扱う巨大なオープンソースプロジェクトがあります。私たちの目標は、データとそれを処理する方法をマージして、世界中の集落の特定の地域に関する最も正確で完全な情報を取得することです。明確にするために-私たちは土地利用タイプではなく、これらの地域で起こっている現象やプロセスへの影響の類似性の考え方についてです。したがって、住宅地は都市全体でまったく異なる可能性があるだけでなく、異なるクラスを割り当てる必要があります。一方、ゾーニングアプローチは取り扱っていません。小売とビジネスの領域を1つのグループにまとめる必要はありません。また、教育分野と医療分野に影響を与えるという点で意味があるかどうかは明らかではありません。これらの領域の空間パターンについて。

現在の結果

現在、製品のMVPバージョンをテストし、データ配布の領域内の4つのクラスに関する情報を配信しています。 Aspectumに移動し、データを追加して、都市の土地分類分析を実行します。処理にはしばらく時間がかかる場合があり、まだ多くの制限がありますが、常にアルゴリズムを改善しています。

地域および地域レベルのクラスで地図を確認する

地域および地域レベルのクラス。 Aspectumのスクリーンショット

タスク中に多くの開発が行われましたが、喜んで共有します。 GitHubページをご覧ください。プロジェクトを常に更新および追加しています。最新のアップデートであるosm2geojsonは、OpenStreetMapデータを処理するための純粋なPythonソリューションです。次の記事を見逃さないように、Aspectumをフォローしてください。