10.2 二分探索による挿入¶

二分探索は目標要素を探索するだけでなく、目標要素の挿入位置を探索するなど、多くの変種問題を解決するためにも使用されます。

10.2.1 重複要素がない場合¶

Question

一意の要素を持つ長さ\(n\)のソート済み配列numsと要素targetが与えられ、ソート順を維持しながらtargetをnumsに挿入します。targetが配列にすでに存在する場合は、既存の要素の左側に挿入します。挿入後の配列におけるtargetのインデックスを返してください。下図に示す例を参照してください。

図 10-4 Example data for binary search insertion point

前のセクションの二分探索コードを再利用したい場合、以下の2つの質問に答える必要があります。

質問1：配列にすでにtargetが含まれている場合、挿入位置は既存要素のインデックスになりますか？

targetを等しい要素の左側に挿入するという要件は、新しく挿入されるtargetが元のtargetの位置を置き換えることを意味します。つまり、配列にtargetが含まれている場合、挿入位置は確かにそのtargetのインデックスです。

質問2：配列にtargetが含まれていない場合、どのインデックスに挿入されますか？

二分探索プロセスをさらに考えてみましょう：nums[m] < targetのとき、ポインタ\(i\)が移動します。これは、ポインタ\(i\)がtarget以上の要素に近づいていることを意味します。同様に、ポインタ\(j\)は常にtarget以下の要素に近づいています。

したがって、二分の終了時には確実に：\(i\)はtargetより大きい最初の要素を指し、\(j\)はtargetより小さい最初の要素を指します。配列にtargetが含まれていない場合、挿入位置は\(i\)であることは明らかです。コードは以下の通りです：

PythonC++JavaC#GoSwiftJSTSDartRustCKotlinRubyZig

binary_search_insertion.py

def binary_search_insertion_simple(nums: list[int], target: int) -> int:
    """挿入位置の二分探索（重複要素なし）"""
    i, j = 0, len(nums) - 1  # 両端閉区間 [0, n-1] を初期化
    while i <= j:
        m = i + (j - i) // 2  # 中点インデックス m を計算
        if nums[m] < target:
            i = m + 1  # ターゲットは区間 [m+1, j] にある
        elif nums[m] > target:
            j = m - 1  # ターゲットは区間 [i, m-1] にある
        else:
            return m  # ターゲットが見つかった場合、挿入位置 m を返す
    # ターゲットが見つからなかった場合、挿入位置 i を返す
    return i

binary_search_insertion.cpp

/* 挿入ポイントの二分探索（重複要素なし） */
int binarySearchInsertionSimple(vector<int> &nums, int target) {
    int i = 0, j = nums.size() - 1; // 両端閉区間[0, n-1]を初期化
    while (i <= j) {
        int m = i + (j - i) / 2; // 中点インデックスmを計算
        if (nums[m] < target) {
            i = m + 1; // ターゲットは区間[m+1, j]にある
        } else if (nums[m] > target) {
            j = m - 1; // ターゲットは区間[i, m-1]にある
        } else {
            return m; // ターゲットが見つかったため、挿入ポイントmを返す
        }
    }
    // ターゲットが見つからなかったため、挿入ポイントiを返す
    return i;
}

binary_search_insertion.java

/* 挿入点の二分探索（重複要素なし） */
int binarySearchInsertionSimple(int[] nums, int target) {
    int i = 0, j = nums.length - 1; // 両端閉区間 [0, n-1] を初期化
    while (i <= j) {
        int m = i + (j - i) / 2; // 中点インデックス m を計算
        if (nums[m] < target) {
            i = m + 1; // target は区間 [m+1, j] にある
        } else if (nums[m] > target) {
            j = m - 1; // target は区間 [i, m-1] にある
        } else {
            return m; // target を見つけたので、挿入点 m を返す
        }
    }
    // target を見つけられなかったので、挿入点 i を返す
    return i;
}

binary_search_insertion.cs

[class]{binary_search_insertion}-[func]{BinarySearchInsertionSimple}

binary_search_insertion.go

[class]{}-[func]{binarySearchInsertionSimple}

binary_search_insertion.swift

[class]{}-[func]{binarySearchInsertionSimple}

binary_search_insertion.js

[class]{}-[func]{binarySearchInsertionSimple}

binary_search_insertion.ts

[class]{}-[func]{binarySearchInsertionSimple}

binary_search_insertion.dart

[class]{}-[func]{binarySearchInsertionSimple}

binary_search_insertion.rs

[class]{}-[func]{binary_search_insertion_simple}

binary_search_insertion.c

[class]{}-[func]{binarySearchInsertionSimple}

binary_search_insertion.kt

[class]{}-[func]{binarySearchInsertionSimple}

binary_search_insertion.rb

[class]{}-[func]{binary_search_insertion_simple}

binary_search_insertion.zig

[class]{}-[func]{binarySearchInsertionSimple}

10.2.2 重複要素がある場合¶

Question

前の質問に基づいて、配列に重複要素が含まれている可能性があると仮定し、他はすべて同じとします。

配列にtargetの複数の出現がある場合、通常の二分探索はtargetの1つの出現のインデックスのみを返すことができ、その位置の左右にtargetの出現がいくつあるかを特定することはできません。

問題では目標要素を最も左の位置に挿入することが要求されているため、配列内の最も左のtargetのインデックスを見つける必要があります。最初に下図に示すステップを通してこれを実装することを考えてみましょう。

二分探索を実行してtargetの任意のインデックス、例えば\(k\)を見つけます。
インデックス\(k\)から開始して、最も左のtargetの出現が見つかるまで左に線形探索を行い、このインデックスを返します。

図 10-5 Linear search for the insertion point of duplicate elements

この方法は実現可能ですが、線形探索を含むため、時間計算量は\(O(n)\)です。この方法は、配列に多くの重複するtargetが含まれている場合に非効率です。

今度は二分探索コードを拡張することを考えてみましょう。下図に示すように、全体的なプロセスは同じままです。各ラウンドで、まず中間インデックス\(m\)を計算し、次にtargetとnums[m]の値を比較して、以下のケースになります。

nums[m] < targetまたはnums[m] > targetのとき、これはtargetがまだ見つかっていないことを意味するため、通常の二分探索を使用して探索範囲を狭め、ポインタ\(i\)と\(j\)をtargetに近づけます。
nums[m] == targetのとき、これはtargetより小さい要素が範囲\([i, m - 1]\)にあることを示すため、\(j = m - 1\)を使用して範囲を狭め、ポインタ\(j\)をtargetより小さい要素に近づけます。

ループ後、\(i\)は最も左のtargetを指し、\(j\)はtargetより小さい最初の要素を指すため、インデックス\(i\)が挿入位置です。

図 10-6 Steps for binary search insertion point of duplicate elements

以下のコードを観察してください。分岐nums[m] > targetとnums[m] == targetの操作は同じであるため、これら2つの分岐をマージできます。

それでも、ロジックがより明確になり、可読性が向上するため、条件を展開したままにしておくことができます。