Array
- 分為兩大類,一類Static Array,一類是Dynamic Array。
- Static Array:Block of continuous memory space,可以通過indexing來訪問這塊內存空間中的元素。
- Dynamic Array:底層還是static array,只是編程語言為了方便我們使用,在基礎上幫我們添加了一些常用的API,比如
push
,insert
,remove
等等的方法,可以讓我們更方便地操作數組元素。
// define a static array of size 10
int arr[10];
// initialize the array values to 0 using memset function
memset(arr, 0, sizeof(arr));
// assign values using index
arr[0] = 1;
arr[1] = 2;
// retrieve values using index
int a = arr[0];
What int arr[10]
do?
- Allocate了一段連續的內存空間,大小是
10 * sizeof(int)
bytes,一個int
在computer memory佔了4 bytes,共40bytes - 定義了一個名為
arr
的數組指針,指向這段內存空間的首地址
而arr[1] = 2
主要做了以下幾件事情:
- 計算
arr
首地址加上1 * sizeof(int)
bytes的offset, 找到內存空間中的第二個元素的首地址 - 從這個地址開始的4個bytes的內存空間中寫入了整數2
總結: 可以隨機訪問:只要給任何一個數組的index,可以在O(1)的時間內直接取到對應元素的值 因為我可以通過首地址和索引直接計算出目標的內存地址。計算機的內存尋址時間可以認為是O(1),所以數組的隨機訪問時間複雜度是O(1)
CRUD Operations
Create
Scenario 1: 數組末尾追加(append)元 素
- 比方說,我有一個大小為10的數組,裡面裝了4個元素,現在想在末尾追加一個元素,那麼直接assign value在對應的索引就可以了。
Scenario 2: 數組中間insert元素
- Data Shifting: 給新元素騰出空位,然後才能插入新元素
Scenario 3: 數組空間已滿
- 由於連續內存必須一次性分配,分配完了之後就不能隨意增減了。因為你這個block後面的內存可能已經被其他程序佔用了。
- 只能重新申請一塊更大的內存,把原來的數據復制過去,再插入新的元素。
Delete
Scenario 1:
- 直接把last element標記為一個特別的數值,如: -1。
- delete last element的本質是random access operation,time complexity O(1)
Scenario 2:
- Shifting data: 所有在被delete元素後的元素,都要往前移一個位,令數組不斷裂。
Summary
- Addition增
- Appending an element at the end: O(1)
- Inserting an element in the middle (not at the end): O(N)
- Deletion刪
- Removing an element from the end: O(1)
- Removing an element from the middle (not at the end): O(N)
- Access查: given指定index,查詢index對應的value,Time Complexity: O(1)
- Update改: given指定index,修改index對應的value,Time Complexity: O(1)
- 為什麼array expansion的Time Complexity O(N)沒加到addition中呢?
- 因為expansion不是每次都會trigger的,所以擴容的complexity要用"Amortized Time Complexity"來分析
Circular Array
- 利用modulus(remainder) operation,將普通array變成邏輯上的circular array,讓我們可以用O(1)的時間在數組頭部增刪元素
- 維持了兩個pointer
start
和end
,start
指向第一個有效元素的index,end
指向最後一個有效元素的下一個位置的index - 當增刪頭部元素時,只需要移動
start
index;當增刪尾部元素時,只需要移動end
index - 當
start
和end
超出array boundary時(<0
or>= arr.length
),可以用modulo operation%
去讓它們轉一圈回到數組的頭部或尾部繼續
Code Implementation
- 會使用left-closed和right-open interval,即
[start, end)
,因為最容易handle - 假設initialize
start=end=0
,interval[0,0)
中沒有任何elements,但只要讓end
向右移動(擴大)一位,區間[0,1)
就只包含一個元素了 - 如果區間兩邊都是open,即
(start, end)
,那麼讓end
向右移動一位後,(0,1)
仍然沒有元素 - 如果區間兩邊都是closed,即
[0,0]
,就已經包含了一個元素,這兩種情怳都會為boundary handling帶來不必要的麻煩
Final Thought
- 為什麼很多programming language的底層library不使用circular array來實現dynamic array?
- Circular array的優勢是在head用O(1)插刪元素
- CRUD的所有操作都會涉及
%
modulus operation, 像get
method,調用的頻率很高,加起來的性能損耗大於收益 - 加上數組很少在head做CRUD,如頻繁操作,應使用其他data structure
public class CycleArray<T> {
private T[] arr;
private int start;
private int end;
private int count;
private int size;
public CycleArray() {
this(1);
}
@SuppressWarnings("unchecked")
public CycleArray(int size) {
this.size = size;
// 因为 Java 不支持直接创建泛型数组,所以这里使用了类型转换
this.arr = (T[]) new Object[size];
// start 指向第一个有效元素的索引,闭区间
this.start = 0;
// 切记 end 是一个开区间,
// 即 end 指向最后一个有效元素的下一个位置索引
this.end = 0;
this.count = 0;
}
// 自动扩缩容辅助函数
@SuppressWarnings("unchecked")
private void resize(int newSize) {
// 创建新的数组
T[] newArr = (T[]) new Object[newSize];
// 将旧数组的元素复制到新数组中
for (int i = 0; i < count; i++) {
newArr[i] = arr[(start + i) % size];
}
arr = newArr;
// 重置 start 和 end 指针
start = 0;
end = count;
size = newSize;
}
// 在数组头部添加元素,时间复杂度 O(1)
public void addFirst(T val) {
// 当数组满时,扩容为原来的两倍
if (isFull()) {
resize(size * 2);
}
// 因为 start 是闭区间,所以先左移,再赋值
start = (start - 1 + size) % size;
arr[start] = val;
count++;
}
// 删除数组头部元素,时间复杂度 O(1)
public void removeFirst() {
if (isEmpty()) {
throw new IllegalStateException("Array is empty");
}
// 因为 start 是闭区间,所以先赋值,再右移
arr[start] = null;
start = (start + 1) % size;
count--;
// 如果数组元素数量减少到原大小的四分之一,则减小数组大小为一半
if (count > 0 && count == size / 4) {
resize(size / 2);
}
}
// 在数组尾部添加元素,时间复杂度 O(1)
public void addLast(T val) {
if (isFull()) {
resize(size * 2);
}
// 因为 end 是开区间,所以是先赋值,再右移
arr[end] = val;
end = (end + 1) % size;
count++;
}
// 删除数组尾部元素,时间复杂度 O(1)
public void removeLast() {
if (isEmpty()) {
throw new IllegalStateException("Array is empty");
}
// 因为 end 是开区间,所以先左移,再赋值
end = (end - 1 + size) % size;
arr[end] = null;
count--;
// 缩容
if (count > 0 && count == size / 4) {
resize(size / 2);
}
}
// 获取数组头部元素,时间复杂度 O(1)
public T getFirst() {
if (isEmpty()) {
throw new IllegalStateException("Array is empty");
}
return arr[start];
}
// 获取数组尾部元素,时间复杂度 O(1)
public T getLast() {
if (isEmpty()) {
throw new IllegalStateException("Array is empty");
}
// end 是开区间,指向的是下一个元素的位置,所以要减 1
return arr[(end - 1 + size) % size];
}
public boolean isFull() {
return count == size;
}
public int size() {
return count;
}
public boolean isEmpty() {
return count == 0;
}
}