
2013年10月8日 星期二


相對於stack的資料後進先出(LIFO),在現實生活中,先排隊的就會先跟櫃台買東西(FIFO),就會有相應的結構,就稱之為queue。通常在程式的實作上,目前的作業系統,不管是windows或是linux based(include mac)工作的排程都是採取FIFO的模式。也就是先預備執行的程式就會優先的先去執行。比如有工作ABCD依照順序的排入系統去執行,對於系統這種多工性的格式來說,會把每一項工作都切分開A->dA+dA+dA+dA.....。如果沒有預設的優先執行緒,一般來說執行方式都會如此:dA->dB->dC->dD -> dA->dB->dC->dD.....當然就演算法來看有其他更有效率的排法。但是目前最廣泛的方式仍然是FIFO的方式去執行。

基本上只要看過了linked list那個章節,stack和queue只是其應用,並不難,所不同的只是資料的排序方式而已。

因此我們先從資料的新增開始吧。概念上很簡單,新增的資料永遠都放在尾即可(Last In Last Out):
typedef struct queue {
   int data;
   struct queue *next;

queue *first = NULL;
queue *end = NULL;

// add data value n to queue list
void add(int n)
   // create a node for n
   queue *in;
   in = (queue *) malloc(sizeof(queue));
   in->data = n;

   in->next = NULL;

   if (end == NULL)
      first = end = in;
   else {
      end->next = in;
      end = in;
在這邊我就沒有在程式內加入英文說明了,基本上linked list那邊看過之後這邊一看就很簡潔明瞭。首先我們declare & define一個node,稱為in是專門放置新增的資料n的:
   queue *in;
   in = (queue *) malloc(sizeof(queue));
   in->data = n;
接著理所當然的linked list尾端接尾之後:in->next = NULL; 我們就先判斷目前這個queue中是否現有資料才能做link的動作(如果沒有資料而去做link,那麼pointer會沒有一個definition而終告失敗):
   if (end == NULL)
      first = end = in;
   else {
      end->next = in;
      end = in;

以上就是queue的新增資料,基本上和linked list的insert_in_tail()的function是一模一樣的東西。

而如果要pop out資料呢,那麼秉持著FIFO(LILO)的演算,我們首先要pop out的就會是頭,first:
// remove and return data from first
int pop(void)
   queue *out = first;

   if (out != NULL) {
      first = first->next;
      int val = out->data;
      return val;
   queue *out = first;

如果有資料在裡頭,我們就移動first到第二個node上面去,然後把要pop out的value暫存下來之後,這個node就可以free掉了。最後再回傳值就可以。


2013年9月22日 星期日

stack-push & pop

typedef struct node {
   int data;
   struct node *next;

// TOP of a stack
node *top = NULL;

// push a value into a stack
void push(int val)
   // allocate a new node for val
   node *new_node =(node*) malloc(sizeof(node));
   new_node->data = val;
   new_node->next = top;
   top = new_node;
// pop a value out from the stack
int pop(void)
   // tmp for record the top node
   node *tmp;
   int return_value;
   // if there is an existing data in stack
   if (top != NULL) {
      // get the value of the top
      return_value = top->data;
      // record the top node
      tmp = top;
      // change top
      top = top->next;
      return return_value;
      printf("no existing data in the stack!\n");

// show the stack
void show_stack(void)
   node *rush = top;
   printf("\nthe stack is:\n");
   while (rush != NULL) {
      printf("%d ", rush->data);
      rush = rush->next;
int main()
   printf("Enter values:\n");
   int n;
   while (scanf("%d", &n) != EOF) {
      printf("%d ",n);


   return 0;
堆疊顧名思義就如同一疊一疊很重的貨物,擺放的時候當然是從下往上疊,拿的時候就從上面拿到下面。這是最順手的方式。這種資料的存取就稱為是Last In First Out。在底層的角度來說,compiler在處理function也是如此實做,詳情也可參考計算機組織結構。os會在記憶體之中規畫一個stack區域,專門記錄函式的返回位置。

比如一個主程式位址從0~100。中間有個function A位於49,那麼在執行完這function A的時候就需要回到第50這個位置,但是有可能function內又有一個function,於是我們不僅要把50放入stack先做儲存,也必須把function A內另一個function返回位置也儲存下來。但是先後順序當然是越裡面的位置要先要拿出來返回,於是最後放入的(Last In)位置就當然是會優先返回(First Out)。這就是stack。

當然實做上不是只有使用stack來當作function的返回記錄,以現今高速處理的計算機而言,要每次去access記憶體也是需要花很多時間的,因此目前採用的做法都是直接放入暫存器內而不放在記憶體中。另一種方式就是把返回位址寫在程式內,也就是直接在一個function的結尾多上一個jp (addr)的指令,這種方式就不用堆疊了。

題外話不多說,基本上他和linked list是差不多的架構,唯一不同的就是連接起來的方式,新加入的資料永遠都會擺在頭的位置。
void push(int val)
   // allocate a new node for val
   node *new_node =(node*) malloc(sizeof(node));
   new_node->data = val;
   new_node->next = top;
   top = new_node;


  if (top != NULL){
    printf("no existing data in the stack!\n");
      return_value = top->data;
      // record the top node
      tmp = top;
      // change top
      top = top->next;
      return return_value;

2013年9月10日 星期二

link list-小專題-記憶體管理-free

// move the nth node out from occupied list
MemInfo *move_out(int n)
   MemInfo *rush = head_occupy;
   // get the nth node
   while (n != 0) {
      rush = rush->next;
   // prev->rush->next
   // prev->next
   if (rush->next != NULL)
      rush->next->prev = rush->prev;
   if (rush == head_occupy)
      head_occupy = rush->next;
      rush->prev->next = rush->next;
   return rush;

// move node to free list
void free_(MemInfo *node)
   MemInfo *rush, *prev;
   // initialize rush as head
   rush = head_free;
   // find out the position where node should
   // be put in
   while (rush->begin < node->begin) {
      prev = rush;
      rush = rush->next;
   // if this node should be put in the first place
   if (rush == head_free) {
      // if rush is right after node
      if (rush->begin == node->begin + node->size) {
         // then merge them together
         rush->begin = node->begin;
         rush->size += node->size;
      // otherwise
      else {
         node->next = rush;
         node->prev = NULL;
         rush->prev = node;
         head_free = node;
   // if node is right after prev
   else if (prev->begin + prev->size == node->begin) {
      // merge them together
      prev->size += node->size;
      // if they are connected together
      if (prev->begin + prev->size == rush->begin) {
         prev->size += rush->size;
         prev->next = rush->next;
         if (rush->next != NULL)
            rush->next->prev = prev;
   // else, connect them
   else {
      node->next = rush;
      node->prev = prev;
      rush->prev = node;
      prev->next = node;


因此這邊我們就寫了一個function:move_out(),它將會從occupied list中移出第n個node出來。

我們declare一個pointer rush讓它從head_occupy開始去找第n個node,然後用while迴圈去判斷是否到達第n個node:
   MemInfo *rush = head_occupy;
   // get the nth node
   while (n != 0) {
      rush = rush->next;
while(rush != NULL &&n != 0) {
   rush = rush->next;
if (n != 0) {
   printf("occupied list doesn't has %d elements!\n", n);
否則如果這個occupied list根本就不足n個element的時候,rush將不會是well defined的指標,它將會跑到NULL去,接著rush->next將會不存在。

   if (rush->next != NULL)
      rush->next->prev = rush->prev;
   if (rush == head_occupy)
      head_occupy = rush->next;
      rush->prev->next = rush->next;
最後return rush便完成了我們要的move_out的function,也就是初步的free就應當先把node移出去。
   while (rush->begin < node->begin) {
      prev = rush;
      rush = rush->next;

   if (rush == head_free) {
      // if rush is right after node
      if (rush->begin == node->begin + node->size) {
         // then merge them together
         rush->begin = node->begin;
         rush->size += node->size;
      // otherwise
      else {
         node->next = rush;
         node->prev = NULL;
         rush->prev = node;
         head_free = node;
      if (rush->begin == node->begin + node->size) {
         // then merge them together
         rush->begin = node->begin;
         rush->size += node->size;
而如果中間有斷層的話,就不用這樣處理,就直接linked list接上去就可以了:
      else {
         node->next = rush;
         node->prev = NULL;
         rush->prev = node;
         head_free = node;

   else if (prev->begin + prev->size == node->begin) {
      // merge them together
      prev->size += node->size;
      // if they are connected together
      if (prev->begin + prev->size == rush->begin) {
         prev->size += rush->size;
         prev->next = rush->next;
         if (rush->next != NULL)
            rush->next->prev = prev;
      prev->size += node->size;
      if (prev->begin + prev->size == rush->begin) {
         prev->size += rush->size;
         prev->next = rush->next;
         if (rush->next != NULL)
            rush->next->prev = prev;
這時後要注意的是prev的next指向的地方需要改正。那麼為什麼上一次處裡不需要改正prev->next = node->next呢? 因為node並沒有next,而且prev的next並不需要改。最後的if就是判斷是否為尾端,如果不是尾端我們再行處理,否則NULL的prev是沒有定義的。

   else {
      node->next = rush;
      node->prev = prev;
      rush->prev = node;
      prev->next = node;

2013年9月4日 星期三

link list-小專題-記憶體管理-增加occupy list

// add node to occupy list
void add_to_occupy_list(MemInfo *node)
   // set this node to head of the occupy list
   node->prev = NULL;
   if (head_occupy != NULL)
      head_occupy->prev = node;
   node->next = head_occupy;
   head_occupy = node;

我們除了要記錄可用的list以外,也同時必須記錄已經使用的list才有意義。因此不管是從first fit又或是best fit return出來的node是已經使用中了,那麼就必須要把這個node加到head_occupy上。這邊的function就是在做這件事情。

而為了節省速度,使用了有點像是先進後出的概念去做這一條head_occupy的list,也就是head_occupy always是指向最新使用的node,當然要節省速度也不是只有這種方法,我們也可以使用tail_occupy去指向這個list的tail,而由於是雙向的list,因此可以使用prev指標便能輕易的移動。

   node->prev = NULL;
   if (head_occupy != NULL)
      head_occupy->prev = node;
  node->next = head_occupy;

2013年9月3日 星期二

link list-小專題-記憶體管理-best fit allocation

// allocate a memory in a linked list by best fit
MemInfo *best_fit_mem_alloc(unsigned size)
   MemInfo *best_fit = NULL, *data, *rush;
   // record the smallest difference
   int smallest_diff = INT_MAX;
   // assigned this from head node for un-used memory
   rush = head_free;
   // find out the best fit
   while (rush != NULL) {
      if (rush->size > size &&
                (rush->size - size) < smallest_diff) {
         smallest_diff = rush->size - size;
         best_fit = rush;
      rush = rush->next;
   // if we could find out the best fit
   if (best_fit != NULL) {
      // allocate a memory
      data = (MemInfo*) malloc(sizeof(MemInfo));
      data->begin = best_fit->begin;
      data->size = size;
      if (best_fit->size > size) {
         best_fit->begin += size;
         best_fit->size -= size;
      else {
         // jusdge if this is head
         if (best_fit == head_free)
            head_free = best_fit->next;
            best_fit->prev->next = best_fit->next;
         // if this is not tail
         if (best_fit->next != NULL)
            best_fit->next->prev = best_fit->prev;
   return (data);
基本上best fit和first fit整體的程式邏輯是相同的,唯一不同的地方就是前面要尋找出最適合大小的size的node而已。因此這邊就導入了一個pointer: rush專門用來當成是迴圈從head跑到最後。唯有這種方式才能找到最適合大小的size。

因此我們修改下while的條件為rush != NULL表示rush要從頭跑到尾,然後best_fit的指標就是專門記載"目前最適合的node"的位置,我們並添加了一個smallest_diff就是專門記載"目前最適合的node"的size和我們需要大小的差異。差異越小的越是滿足最適合大小的要件:
   while (rush != NULL) {
      if (rush->size > size &&
                (rush->size - size) < smallest_diff) {
         smallest_diff = best_fit->size - size;
         best_fit = rush;
      rush = rush->next;
所以我們這邊就多添加了一個if就是專門記載best_fit以及smallest_diff,記錄最適合大小的pointer以及size差異值。如果目前的node: rush的size比我們要allocate的size還大,並且size的差異呢,還比上一筆best_fit的差異還小的話,那麼它就會比上一筆best_fit還更適合當最適合大小的node。這邊的邏輯便然是如此。

接下來的程式就會和first fit是一模一樣的做法,詳情就請參考上一篇的first fit allocation。

2013年8月30日 星期五

link list-小專題-記憶體管理-first fit allocation

// node structure for memory info
typedef struct MemInfo {
   unsigned begin, size;
   struct MemInfo *prev, *next;

// head node for occupied memory linked list
MemInfo *head_occupy = NULL;
// head node for un-used memory linked list
MemInfo *head_free = NULL;

MemInfo *tail_free = NULL;
// insert data to tail of the linked list
void Mem_info_insert_in_tail(unsigned begin, unsigned size)
   // create a new node for this data
   MemInfo *data = (MemInfo*) malloc(sizeof(MemInfo));
   data->begin = begin;
   data->size = size;

   // if there is no existing data
   if (head_free == NULL)
      head_free = tail_free = data;
   else {
      tail_free->next = data;
      data->prev = tail_free;
      data->next = NULL;
      tail_free = data;

void Mem_info_show_list(void)
   MemInfo *rush = head_free;
   printf("The result is:\n");
   while (rush != NULL) {
      printf("(%d, %d) ", rush->begin, rush->size);
      rush = rush->next;
// allocate a memory in a linked list by first fit
MemInfo *first_fit_mem_alloc(unsigned size)
   MemInfo *first_fit, *data = NULL;
   // assign this from head node for un-used memory
   first_fit = head_free;
   // find out first_fit node
   while (first_fit != NULL && first_fit->size < size)
      first_fit = first_fit->next;
   // if we could find out one
   if (first_fit != NULL) {
      // allocate memory for this data
      data = (MemInfo*) malloc(sizeof(MemInfo));
      data->begin = first_fit->begin;
      data->size = size;
      // if the size of this first fit is larger than
      // allocation, then calculate the new size
      if (first_fit->size > size) {
         first_fit->begin += size;
         first_fit->size -= size;
      else {
         // judge if this is head
         if (first_fit == head_free)
            head_free = first_fit->next;
            first_fit->prev->next = first_fit->next;
         // if this is not tail
         if (first_fit->next != NULL)
            first_fit->next->prev = first_fit->prev;
   } // if (first_fit != NULL)
   return data;

int main()
   unsigned begin, size;
   printf("Mem info linked list:\n");
   fin = fopen("mem_info_input", "r");
   while (fscanf(fin, "%d %d", &begin, &size) != EOF) {
      printf("(%d, %d) ", begin, size);
      Mem_info_insert_in_tail(begin, size);

   return 0;


記憶體的管理,是我們在目前幾乎所有的os都會碰到的課題。因為都是多工的,也就是許多的job都會切成一小段一小段分別/管線/平行的去執行。而多個程式也會因此同時在記憶體之中allocate。但因為切分的關係,每支程式所需要的記憶體都不盡然相同。有的要42K,有的要32M,有的只需小小的0.1K。而正常的程式在執行結束之後,都會free掉記憶體。因此常常會出現中間部分的記憶體是已經free掉了,因此我們需要記錄那塊free掉的記憶體的位置以及資料,這樣才能夠利用。在這使用了linked list來當作實做的工具。這個list會有四筆資料在內。我們用了雙向的linked list於是有兩筆分別指向前(prev)與後(next)的node。然後我們還需要這個node的記憶體起始位置(begin)以及大小(size):
typedef struct MemInfo {
   unsigned begin, size;
   struct MemInfo *prev, *next;

而我們也使用了兩個串列,一個串列head_free是為了記錄有哪些記憶體是空的,可以使用的。那麼相反的,head_occupy就會是記錄目前使用中的記憶體的串列。而一樣linked list為了方便起見我們也記錄了尾端tail_free

為了實做allocation,一樣我們還是需要資料輸入工具,因此邏輯上相同於普通的linked list中的insert_in_tail(),在這邊我們唯一不同的就是輸入兩筆記錄begin和size,因此Mem_info_insert_in_tail()基本上就和insert_in_tail()是一樣的東西,不多加贅述。


   MemInfo *first_fit, *data;
   while (first_fit != NULL &&first_fit->size < size)
      first_fit = first_fit->next;
   if (first_fit != NULL) {
      // allocate memory for this data
      data = (MemInfo*) malloc(sizeof(MemInfo));
      data->begin = first_fit->begin;
      data->size = size;
而所謂的後續的處理呢,有兩種狀況,第一種就是我們尋找到的node的size比我們需求的大,這時候處理方式就會是把我們找到的node的起始位置begin往下移開size大小(因為我們要在這個node的記憶體allocate size大小,所以free的起始位置就會少掉了size大小),同時這個node的大小便同時會減少了size這麼大:
      if (first_fit->size > size) {
         first_fit->begin += size;
         first_fit->size -= size;
      else {
         // judge if this is head
         if (first_fit == head_free)
            head_free = first_fit->next;
            first_fit->prev->next = first_fit->next;
         // if this is not tail
         if (first_fit->next != NULL)
            first_fit->next->prev = first_fit->prev;
  return data

2013年8月23日 星期五

link list-double link list的刪除某值

typedef struct Dnode {
   struct Dnode *prev;
   int val;
   struct Dnode *next;

Dnode *Dhead = NULL;

// show doule linked list elements
void Dshow_list(void)
   Dnode *rush = Dhead;
   printf("\n The result is:\n");
   while (rush != NULL) {
      printf("%d ", rush->val);
      rush = rush->next;

// delete a specified value from a double linked list
void Ddelete_specified_data(int val)
   Dnode *rush, *prev;
   rush = Dhead;
   // find out the value
   while (rush->val != val) {
      prev = rush;
      rush = rush->next;
   // if there is no found or no data in the linked list
   if (rush == NULL) {
      printf("No found!/ No existing data!\n");
   // now rush is the node which has the value
   // then delete rush
   // if 1st data is rush
   if (rush == Dhead) {
      rush->next->prev = NULL;
      Dhead = rush->next;
   // or if rush is the tail
   else if (rush->next == NULL) {
      rush->prev->next = NULL;
      Dtail =rush->prev;
   // else
   else {
      rush->prev->next = rush->next;
      rush->next->prev = rush->prev;


Dnode *Dtail = NULL;
// insert data to tail of the linked list
void Dinsert_in_tail(int val)
   // allocate memory for this new node
   Dnode *data = (Dnode*) malloc(sizeof(Dnode));
   data->val = val;
   data->next = NULL;

   // if there is no existing nodes in the list
   if (Dhead == NULL) {
      // then head = tail = node
      Dhead = Dtail = data;
      data->prev = NULL;
   else {
      Dtail->next = data;
      data->prev = Dtail;
      Dtail = data;


int main()
   int n;
   printf("Double linked list:\n");
   FILE *fin;
   fin = fopen("input", "r");
   while (fscanf(fin, "%d", &n) != EOF) {
      printf("%d ", n);

   return 0;


單向的(也就是基本型態)linked list有個壞處就是不能反向移動。當然使用環狀的結構是可以繼續往下走然後找到自己想要的element,但如果資料過長,而你想要找的資料剛好是目前的正上方,這時候使用環狀結構反而是浪費了一堆時間。因此我們便多使用了一個儲存空間,使用了指標去指向目前node的上一個。
typedef struct Dnode {
   struct Dnode *prev;
   int val;
   struct Dnode *next;

雙向linked list在刪除某值的時候,要注意的是我們要處理的工夫會多雙倍。原本的單向只需要把前一個node的next指向下一個node就可以刪除了。但在這邊,我們必須要注意很多地方。

   if (rush == Dhead) {
      rush->next->prev = NULL;
      Dhead = rush->next;

   else if (rush->next == NULL) {
      rush->prev->next = NULL;
      Dtail =rush->prev;
(1) 前一個node的next指向下一個node
(2) 下一個node的prev指向前一個node
      rush->prev->next = rush->next;
      rush->next->prev = rush->prev;

2013年8月21日 星期三

link list-reverse

// reverse a link list
void reverse_link_list(void)
   // we need 3 pointers to keep going
   node *rush, *prev, *now;

   // initialize
   rush = head;
   now = NULL;

   // loop from head to final
   while (rush != NULL) {
      // prev now rush
      prev = now;
      now = rush;
      rush = rush->next;
      // prev<-now rush
      now->next =prev;
   // assign head to now
   head = now;

反轉一個link list我們會需要三個指標。因為如果照以前一樣只用兩個指標來做的話:
while (rush != NULL) {
   prev = rush;
   rush = rush->next;
   rush->next = prev;
我們會永遠沒辦法往下一個node前進,因為現有的now的next已經往前接了,而該往後的node會因此斷了音訊。所以我們需要一個pointer來保存下一個node的位置。因此rush是用來保存下一個node的位置,而now是現有的node,prev則是前一個node。由於我們要反轉一個link list,所以now的next應當接在prev上。

我們初始化指標使得: now(NULL) rush(head)

      prev = now;
      now = rush;
      rush = rush->next;
      // prev<-now rush
      now->next =prev;
就會讓前頭長成這樣 prev(NULL)<-now(head) rush(next)

這樣子我們就把目前的head接給NULL,也因為我們要反轉的關係,head將來就會成為最後一個節點,而我們知道最後一個節點的next是NULL,因此這樣做是沒問題的,這也是支所以我們把now initialize為NULL的初衷。

與使用兩個指標的方式不同的是,由於我們有保存下一個指標的位址rush,所以我們要往下一個節點邁進的時候,只需要把rush assign給now。然後rush就可以往下一個節點邁進。

接著最後再把head assign給目前的now(而不是rush!因為經過迴圈之後rush已經是NULL了):
   head = now

2013年8月19日 星期一

link list-清除link list

// free all nodes in the link list
void free_all_nodes(void)
   node *rush, *prev;
   // if there is no existing element, jump out
   if (head == NULL) {
      printf("No existing element!\n");
   // initialize rush as head
   rush = head;
   // free all elements
   while (rush != NULL) {
      prev = rush;
      rush = rush->next;
當我們allocate一個link list的時候,記憶體會騰出空間出來。當然C的程式的default會在程式結束之後把記憶體清空。但是如果你有程式是巨量資料,那麼這list要清空騰出記憶體是無可避免的。

因此要清空一個list的記憶體的方式就是從頭慢慢的一個一個開始清。他不像是一般array使用free就可以清除一整筆資料。由於目前的link list是單向的,所以清除順序勢必是要從head開始清除。

所以首先我們需要先判斷link list裡面究竟有沒有existing的node再來決定要不要清除。因為如果沒有的話便會清除到NULL指標。當然也許程式可能是容許的,但是如果可以養成程式能夠自我預警,那麼日後出現任何問題都能夠容易debug,也能夠有點像是封裝概念一般省去一堆debug的時間。
   if (head == NULL) {
      printf("No existing element!\n");

接著initialize rush為head之後開始迴圈一個一個開始free掉每個node:
   rush = head;
   // free all elements
   while (rush != NULL) {
      prev = rush;
      rush = rush->next;

2013年8月18日 星期日

link list-刪除某值之資料

// delete a node of data val in a link list
void delete_specified_data(int val)
   node *rush, *prev;
   rush = head;
   // search for data val
   while (rush != NULL && val != rush->val) {
      prev = rush;
      rush = rush->next;
   // if there is no result
   if (rush == NULL) {
      printf("Data no found!\n");
   // if that result is the first node,
   // then head will be the next node
   else if (rush == head)
      head = rush->next;
   // else, pull out the node
      prev->next = rush->next;

這個是只刪除某一個值,但是只刪除一個而已,因此如果一個數列23 54 54 34 65 12 在這邊如果刪除54的話,只會刪除第一個54。 所以概念上就是從link list之中從頭開始找,找到符合值為val的就把它刪除,刪除方式就是把他前面的node的next接它後面。接著再free掉它。
   rush = head;
   // search for data val
   while (rush != NULL && val != rush->val) {
      prev = rush;
      rush = rush->next;
首先把探索用的指標rush initialize為head,接著迴圈內就開始找第一個符合我們要找的值的node為止。這時候rush有幾種情形
1. 第一個node就找到了
2. 沒有找到
3. 找到了,但不是1.的情形

while內的條件最好是該有正確的boundary判斷,因此rush != NULL,因為筆者的參考書沒有這一段,所以特別標明這一點。如果這個link list沒有找到我們要找的資料的話,那麼最後rush會跑到NULL上,接著會讀取不存在的記憶體rush = rush->next,這樣是有問題的。

   else if (rush == head)
      head = rush->next;
   // else, pull out the node
      prev->next = rush->next;
所以第一個else if就是判斷第一個情形,這時候因為我們要移掉的是第一個node,處理方式就是重新指定head為後一個node就行了。而第三種情形的處理方式就是把前面那個node往後接給後面那一個node。

   if (rush == NULL) {
      printf("Data no found!\n");
就該把沒找到的訊息印出來並且直接跳出去。筆者的參考書一樣沒這一段,雖然本身無關緊要。因為如果沒有找到的話,那麼我們最後要free()的時候便會free掉什麼都沒有的NULL,這本身是沒什麼問題的。但寫程式概念還是要清楚,畢竟free是用在有memory allocate的情形的。萬一某個部分沒有寫好,比如我們的while如果沒有判斷rush != NULL,這時候會發生什麼事情也不曉得。即使free掉NULL沒什麼要緊的,但寫給自己看也讓自己提醒自己該注意的地方是什麼才是重要的。

2013年8月16日 星期五

link-list 資料插尾插頭

// insert val in head of a link list
void insert_in_head(int val)
   // create a node for val
   node *data = (node *) malloc(sizeof(node));
   data->val = val;
   // link head next to data
   data->next = head;
   // new head = data
   head = data;
node *tail = NULL;
// insert val in tail of a link list
void insert_in_tail(int val)
   // create a node for val
   node *data = (node *) malloc(sizeof(node));
   data->val = val;
   // link NULL to data
   data->next = NULL;

   // if there is no existing node
   if (head == NULL)
      // then this node is head and also tail
      head = tail = data;
   else {
      // otherwise, this node is new tail
      tail->next = data;
      tail = data;
資料的插頭,就是把一筆資料直接放入到link list的頭端,如果沒有資料那麼這筆資料就會是新的頭。如果有資料的話那麼目前的頭就會被接在這筆新資料之後。
   data->next = head;
   // new head = data
   head = data;
在create一個node之後我們便把目前的頭接在這筆新資料之後,然後新的頭就會是這筆新資料。在此,即使是沒有任何資料的狀態也不會有問題,因為沒有任何資料的狀況之下,我們早在一開始便把head initialize成為NULL了,因此這時候這筆新資料往後接的,便會是NULL,這也是正常該有的狀況。

而資料的插尾,就是把這筆資料直接放到最尾端。我們可以直接一個一個從頭去search next指標直到尾端去找尾端然後把這筆資料往後接上,但這太耗費工夫,尤其如果是巨量資料之下的話會更明顯。因此我們直接create一個指標tail,指向這個list的最後一個node,我們一開始initialize為NULL:
node *tail = NULL;
接著這個程式create memory並放入資料給這筆新資料之後,首先就將這筆新資料的尾端接為NULL:
   data->next = NULL;
然後我們先判定目前是不是現有資料,原因在於如果不管三七二十一不判定有沒有資料而直接把tail往後接給這筆資料的話,會有問題,因為我們並沒有配給tail一個記憶體空間,所以它的next是不存在的,因為即使是指標,還是需要記憶體空間的。所以如果沒有任何資料在list之內,我們直接把tail和head assign給這筆新資料:
   if (head == NULL)
      // then this node is head and also tail
      head = tail = data;
當然我們也可以用tail == NULL來判斷也是一樣的結果。邏輯上來講,如果沒有任何資料存在,那麼這筆新資料就會是這個link list的頭兼尾,這邊程式的邏輯就會把這段話給烙印上去。

接著如果現有資料的話,我們就把tail往後接這筆資料,接著才把tail assign給這筆資料,這邊順序要對,如果我們先把tail assign給這筆新資料在把tail往後接給這筆資料的話,結果會是這筆資料是孤立的,沒有任何資料接它,並且它的next會是接它自己。
      tail->next = data;
      tail = data;

2013年8月14日 星期三

link list-資料的依值插入

typedef struct node {
   int val;
   struct node *next;

node *head = NULL;
// insert value "val" into link list
void insert_value(int val)
   node *prev, *rush;
   // create node for that insertor
   node *data = (node*) malloc(sizeof(node));
   // put the value in that node
   data->val = val;

   prev = rush = head;
   // find out the correct position for val
   while (rush != NULL && val > rush->val) {
      prev = rush;
      rush = rush->next;

   // link it next to the bigger value
   data->next = rush;
   // if there is no element in link list
   // or val is the smallest
   if (rush == head)
      head = data;
      prev->next = data;


// show link list elements
void show_list(void)
   node *rush = head;
   printf("\nThe result is:\n");
   while (rush != NULL) {
      printf("%d ", rush->val);
      rush = rush->next;

int main()
   int n;
   printf("Enter values:\n");
   while(scanf("%d", &n) != EOF) {
      printf("%d ", n);
   return 0;




1. 找到相等又或是比插入值還大的node
2. 把插入值的node next 接在1.前面
3. 把比插入值還小的node接在插入值前面,如果是NULL node又或是插入值是最小的,那麼插入值它就會是head

因此指標prev和rush就是在step 1中為了找出比插入值還小的prev的node,以及該接在插入值後面的rush

   while (rush != NULL && val > rush->val) {
      prev = rush;
      rush = rush->next;

從while迴圈跳出來會有兩種情形 a.list是空的 b.list非空的且有找到插入值該有的位置,因此以b.來說,我們依循以上function的邏輯2. 我們就會把插入值的next往後接rush:

   // link it next to the bigger value
   data->next = rush;
但如果是情形a呢?這也沒問題,因為即使是空的,我們一開始initialize head是NULL的,而link list的尾端總是NULL的,所以目前的rush也會是NULL的。所以把插入值的尾端這樣接是不會有問題的。

   if (rush == head)
      head = data;
      prev->next = data;


2013年8月12日 星期一

陣列-sparse matrix的轉置

void trans_spm(spm *orig, spm *trans)
   // sofar is the index for trans
   int col, i, sofar = 1;
   // initialize matrix info
   int TotalCol = trans[0].row = orig[0].col;
   trans[0].col = orig[0].row;
   int TotalElements = trans[0].val = orig[0].val;

   // loop with column index
   for (col = 0; col < TotalCol; col++)
      // search all over the elements
      // for the same column
      for (i = 1; i <= TotalElements; ++i)
         if (orig[i].col == col) {
            // add the same column elements to trans
            trans[sofar].row = col;
            trans[sofar].col = orig[i].row;
            trans[sofar].val = orig[i].val;

sparse matrix的轉置矩陣,其做法的原理很簡單,首先的資料部分row 和column數目對調就是轉置的結果,總element數目不變。接著再以column為主,從原先的矩陣依照(column, row)的順序把每一個element抽出來放到轉置矩陣去。

因此首先有dummy index:
   int col, i, sofar = 1;
col是給column用的index,為了loop in column。而i則是跑全部的element。sofar則是記錄目前在轉置矩陣上的index。
接著把矩陣資料排好給轉置矩陣後,就開始依據(column, row)的順序把element從原矩陣中抽出。
  for (col = 0; col < TotalCol; col++)
因為我們要排的是轉置的矩陣,因此原先的矩陣排列方式是(row, column),那麼現在的轉置矩陣就會是原矩陣的相反(column, row)。首先的迴圈就run over all column的index去依據column大小的順序去排列轉置矩陣。
      for (i = 1; i <= TotalElements; ++i)
         if (orig[i].col == col) {
            // add the same column elements to trans
            trans[sofar].row = col;
            trans[sofar].col = orig[i].row;
            trans[sofar].val = orig[i].val;
我們便每次都從第一個element開始排列順序,我們每一次一個column都會從頭從原矩陣的每個element找起,找的目標就是當下的column,比如我們開始排列第0個column,那麼我們便從原矩陣找column為0的。而原矩陣的row和column早就已經排列過了,因此我們就按照element的順序去找起即可,而不需要考慮row的順序。當我們找到當下的column的時候,便把這個element assign給轉置矩陣,當然row和column是要對調的,而值是相同的。因此按照這樣的邏輯下去這個轉置矩陣變這樣完成。

2013年8月5日 星期一

陣列-sparse matrix的加法

// add sparse matrix c = a + b
void add_spm(spm *c, spm *a, spm *b)
   int ia = 1; // index for a
   int ib = 1; // index for b
   int ic = 1; // index for c

   // while both index are not yet reach the end
   while (ia <= a[0].val && ib <= b[0].val)
      // if a position > b position, then assign b to c
      if (a[ia].row > b[ib].row ||
          a[ia].row == b[ib].row && a[ia].col > b[ib].col)
         c[ic++] = b[ib++];
      // if a position < b position, then assign a to c
      else if (a[ia].row < b[ib].row ||
               a[ia].row == b[ib].row && a[ia].col < b[ib].col)
         c[ic++] = a[ia++];
      // if a position = b position, c = a+c
      else {
         // we only save non-zero elements
         int sum = a[ia].val + b[ib].val;
         if (sum != 0) {
            c[ic].row = a[ia].row;
            c[ic].col = a[ia].col;
            c[ic].val = sum;
   /* end while */

   // assign the rest elements a OR b to c
   while (ia <= a[0].val)
      c[ic++] = a[ia++];
   while (ib <= b[0].val)
      c[ic++] = b[ib++];
   // assgin the matrix info to c
   c[0].row = a[0].row;
   c[0].col = a[0].col;
   c[0].val = ic - 1;
  while (ia <= a[0].val && ib <= b[0].val)

      if (a[ia].row > b[ib].row ||
          a[ia].row == b[ib].row && a[ia].col > b[ib].col)
         c[ic++] = b[ib++];
在while迴圈仍有效的前提之下,開始判斷有沒有overlap的element。這邊就判定不是overlap,並且a的目前index的位置是在b之後的,所以我們就直接把b的element assign給c,並且各自的index往下一個element前進,而接著的else if則是相同的邏輯,只是是判定b的index在a之後。
      else {
         // we only save non-zero elements
         int sum = a[ia].val + b[ib].val;
         if (sum != 0) {
            c[ic].row = a[ia].row;
            c[ic].col = a[ia].col;
            c[ic].val = sum;
馬上把a和b的index都往後移,最後最外面的while迴圈跑完之後,有三種情形:1.(a沒有剩下了,b還有) 2.(b沒有剩下了,a還有) 3.(都沒有剩下了) 但不論是怎樣的情形,我們都會跑:
   while (ia <= a[0].val)
      c[ic++] = a[ia++];
   while (ib <= b[0].val)
      c[ic++] = b[ib++];
因為即使是情形1. a沒有剩下的element,我們跑while(ia <= a[0].val)它不會有element要執行,因此這邊是不會跑迴圈的,只會跑下面那個b,而情形2和情形3亦然是如此。最後我們再把這矩陣的資料assign給c就完成了。

2013年7月31日 星期三

陣列-sparse matrix的generation

// sparse matrix structure
typedef struct spm {
   int row; // row position
   int col; // column position
   int val; // value
// generate a sparse matrix from a
void generate_spm(int *a, spm *s)
   // row, column index and counting
   // for nonzero elements
   int r, c, count = 0;
   // initialize first row
   s[0].row = M;
   s[0].col = N;

   for (r = 0; r < M; r++)
      for (c = 0; c < N; c++)
         // if there is an nonzero element
         if (a[r*N + c] != 0) {
            s[count].row = r;
            s[count].col = c;
            s[count].val = a[r*N + c];
   s[0].val = count;
int main()
   int i = 0;
   printf("Enter the matrix elements:\n");
   unsigned size = 0;
   int val;
   while (scanf("%d", &val) != EOF)
   size = show_list_and_size();

   int *a = (int*)malloc(sizeof(int)*size);

   // input M
   FILE *file_in_M;
   file_in_M = fopen("M_size", "r");
   fscanf(file_in_M, "%d", &M);
   if (size % M != 0) {
      fprintf(stderr,"size % M != 0\n");
   N = size / M;

   int count_non_zero = 0;
   // counting nonzero elements of a
   for (i = 0; i < size; ++i)
      if (a[i] != 0)
   // allocating s with size of nonzero elements+1
   spm *s = (spm*) malloc(sizeof(spm)*(count_non_zero+1));

   // generate sparse matrix a to s
   generate_spm(a, s);
   //print out the result
   printf("   row  col  val\n---------------\n");
   for (i = 0; i <= count_non_zero; ++i)
      printf("%5i%5i%5i\n", s[i].row, s[i].col, s[i].val);
   return 0;

這是陣列的一個應用。把一個sparse matrix(也就是matrix的elements有非常多都是0)轉成一個更精簡的matrix,使得:
1. 比較省記憶體空間
2. 處理矩陣運算速度能夠更快

有使用matlab的人如果有研究過的話,應該會曉得這軟體在處理sparse matrix是採用精簡matrix。你可以把它看成是一個對應表格。首先這種表格第一行就是這個矩陣的相關資料。如果這矩陣是M*N的大小,並且有100個非零項的話,那麼這個精簡表格的第一行會是如此的表示:
M   N   100。
0  3  0  0  1
0  2  1  0  3
7  0  9  0  1
3  5  8
0  1  3
0  4  1
1  1  2
1  2  1
1  4  3
2  0  7
2  2  9
2  4  1

看起來好像似乎資料量變多,但其實真正的sparse matrix的非零項會是更多的,假設有一個1000* 1000的matrix,非零項只有10,那麼資料型態若是int的話,原本的矩陣所需要的記憶體空間量將會是sizeof(int) * 1000*1000 但使用這種精簡矩陣的空間量將會大幅減少為sizeof(int)*(10+1) 減少了機乎是100,000倍的空間量。flop次數也更不用講了。


put_to_tail會從io那邊得來的資料放入link list中。接著show_list_and_size會show出link list的資料,來確認放入link list的資料是對的,並同時會回傳資料的筆數。而以此資料的筆數我們就能夠memory allocate資料的大小,並使用list_to_array把link list放入array a以內。

因為筆者的研究本身都是巨量資料,因此是需要memory allocate在記憶體中的,所以這種方式是用一維的陣列來儲存矩陣的資料。因此需要矩陣的input的size M*N。所以開了檔案,input進去M之後check看看這是不是合法的矩陣便能夠了解大小N。

而在generate_spm內我們把矩陣a把它弄成只收集非零項的資料,但即使如此我們還是必須要事先知道大小,因此我們需要一個變數count_non_zero去先了解矩陣有幾個非零項,然後才去mem. allocate我們要的精簡後的matrix s。

把sparse matrix a轉成s後就把s的elements印出來確認無誤。以上就是主要的操作流程。

所以我們需要自訂資料型態spm(sparse matrix的簡寫),有三個elements:
// sparse matrix structure
typedef struct spm {
   int row; // row position
   int col; // column position
   int val; // value

接著generate_spm就將會把sparse matrx(一個1D的array)轉換成表格s。首先這個表格的第一行資料將會是這個sparse matrix的M,N,以及非零項的個數,於是我們就先輸入M和N:

   s[0].row = M;
   s[0].col = N;

   for (r = 0; r < M; r++)
      for (c = 0; c < N; c++)
         // if there is an nonzero element
         if (a[r*N + c] != 0) {
            s[count].row = r;
            s[count].col = c;
            s[count].val = a[r*N + c];

2013年7月29日 星期一

quick sorting的研究和改進

int divide_and_swap_with_d(int *a, int left, int right, long int d)
   // regart the first element as the pivot
   int pivot = a[left];
   int l, r;
   l = left;
   r = right + d;
   do {
      // find out l which the element is bigger/equal than
      // pivot from left hand side
      //do l++; while (l < r &&a[l] < pivot);
      do l += d; while (l<=right && a[l] < pivot);
      // find out r which the element is less/equal than
      // pivot from left hand side
      do r -= d; while (r>=left && a[r] > pivot);
      if (l < r) swap (a+l, a+r);
   } while (l < r);
   // swap both
   a[left] = a[r];
   a[r] = pivot;
   return r;
void quick_sort_with_d(int *a, int left, int right, long int d)

   int pivot;
   if (right > left) {
      // return the pivot in [left:right]
      pivot = divide_and_swap_with_d(a, left, right, d);
      // recursive sorting between [left:pivot-1]
      quick_sort_with_d(a, left, pivot - d, d);
      // recursive sorting between [pivot+1:right]
      quick_sort_with_d(a, pivot + d, right, d);
// shell sort with quick sort kernel
void shell_plus_quick_sort(int *a, int size, int q, int p)
   int start, end;
   long int d = 1;
   // find out d_{n+1} < size
   do {
      d = q*d + p;
   } while (d < size);
   d = (d - p)/q;
   d = (d - p)/q;

   // use quick sort until division distance > 1
   while (d > 1) {
      end = size - (size%d);
      for (start = 0; start < d; ++start)
         quick_sort_with_d(a, start, start + end - d, d);
      d = (d - p)/q;
   // normal quick sorting
   quick_sort(a, 0, size - 1);


這次的改進其實是使用shell sorting,但做sorting的kernel不是insertion,而是使用quick sorting。測量了速度來說,慘不忍睹阿,跟一般的quick又或是shell來比的話,真的速度太慢了。有興趣的人可以自行測看看速度。因為結果太差了,所以把這次的嘗試的失敗的改良放上來討論為何會失敗。

事實上寫到一半的時候大概知道這個跑起來不會比較快而且會慢很多,原因在於它和當時改進insertion使用link list的原因是一樣的,同樣是cache miss的問題。

最主要就是慢在這個kernel:divide_and_swap_with_d,是它造成有這種cache miss的問題,原因在於每次在比較a[l]或a[r]的時候,由於並非是連續的記憶體分佈,造成很有可能抓資料的時候,資料並沒有在cache上面。而必須要通過主記憶體去拿。這樣子一來一往就慢了,簡而言之就是遠水救不了近火。

那麼為什麼使用insertion sorting的kernel反而比較快?明明不是quick sorting本身比insertion sorting快嘛?怎麼可能會使用慢的kernel會比較快呢?

原因在於我們在做insertion sorting的kernel的時候,使用了一個tricky的方法,它並非如所宣稱的順序那樣sorting...比如說d=3的case,他會作這樣的sorting順序:
0 3 1 4 2 5 3 6 4 7 5 8.....
0 3 6 9 12.......    1 4 7 10 13.....    2 5 8 11 12.....
但更改這種方式將會造成速度上的差異,原因就在於cache memory一次都抓一把東西進去,以第一個方式去sorting的話,cache首先也許會抓個16個data進去,也就是在cache裡面,0~15這個範圍內的排序都在裡面做,不需要一直往記憶體那邊拿,但是如果採用第二個方法,每排6個data就得要再次的去記憶體那邊抓資料,會比較沒有效率。當然cache的實作我不是非常了解,他會一次抓幾個data不是很確定,但是可想而知的光是效率部分就會有差。

為了證實我的推論,於是二話不說改寫了下傳統的shell sorting,把他寫成第二個方法並與第一個方法比看看速度,以下是測試結果:
timing for shell 0(d=3*d+1): 13.000000
timing for shell 1 (d=3*d+1): 16.000000

shell 0是原本的寫法,而shell 1是使用演算法宣稱的方式,的確是比較慢,但是速度上差異不明顯,在此使用了20000000大小的array,random的range也是20000000。

以下是改寫成為演算法宣稱的source code:

void shell_sort_1(int *a, int size, int q, int p)
   // the element that want to insert in
   unsigned sofar;
   // previous element index before sofar
   int prev;
   // saving the value of a[sofar]
   int a_sofar;
   int start;
   long int d = 1;
   // find out d_{n+1} < size
   do {
      d = q*d + p;
   } while (d < size);
   d = (d - p)/q;
   d = (d - p)/q;

   // use insertion sort until division distance = 1
   do {
      for (start = 0; start < d; ++ start)
         for (sofar = start + d; sofar < size; sofar += d) {
            a_sofar = a[sofar];
            prev = sofar - d;
            while (prev >= 0 && a_sofar < a[prev]) {
               a[prev + d] = a[prev];
               prev -= d;
            a[prev + d] = a_sofar;
      d = (d - p)/q;
   } while (d >= 1);

2013年7月23日 星期二

quick sorting

int divide_and_swap(int *a, int left, int right)
   // regart the first element as the pivot
   int pivot = a[left];
   int l, r;
   l = left;
   r = right + 1;
   do {
      // find out l which the element is bigger/equal than
      // pivot from left hand side
      do l++; while (a[l] < pivot);
      // find out r which the element is less/equal than
      // pivot from right hand side
      do r--; while (a[r] > pivot);
      if (l < r) swap (a+l, a+r);
   } while (l < r);
   // swap both
   a[left] = a[r];
   a[r] = pivot;
   return r;
// quick sorting
void quick_sort(int *a, int left, int right)

   int pivot;
   if (right > left) {
      // return the pivot in [left:right]
      pivot = divide_and_swap(a, left, right);
      // recursive sorting between [left:pivot-1]
      quick_sort(a, left, pivot - 1);
      // recursive sorting between [pivot+1:right]
      quick_sort(a, pivot + 1, right);
主要有兩個function,其實是可以寫成同一個function省記憶體。因為這邊這個quick sorting是很浪費記憶體空間的sorting,如果把一個function拆成兩個會更浪費記憶體。但為了教學和理解方便將它拆成兩部分。如果對於概念已熟稔,就把它們寫成同一個function來實作。


quick sorting的理論其實很簡單,就是把第一個element當做是基準值,接著從左邊開始往右找到一個大於等於基準值的第一個數,然後從右邊找到小於等於基準值的第一個數,接著把它們swap。接著繼續找直到從左邊找的和從右邊找的位置相交為止。然後把基準值換到最後從右邊找不到比它大的數的那個位置作swap。因此左邊的數就會比基準值小(或等於),右邊的數就會比基準值大。接著再用同樣的方式從左邊到基準值的這一段做quick sorting,然後從基準直到右邊也做同樣的quick sorting。

以排隊的例子來說,簡單來講就是把隊伍中第一個抽出來,然後讓比他矮的排他左邊,比他高的排他右邊。排的方式就是從左邊開始找出比他高的,然後和從右邊開始找出比他矮的交換位置。一直持續的找找到位置是相交的為止。 最後就把那個原本的第一位排到那個和它自己一樣大又或者是比他小一點點的那個位置。



   if (right > left) {
      // return the pivot in [left:right]
      pivot = divide_and_swap(a, left, right);
      // recursive sorting between [left:pivot-1]
      quick_sort(a, left, pivot - 1);
      // recursive sorting between [pivot+1:right]
      quick_sort(a, pivot + 1, right);
首先是這個程式的邏輯。if所包著的,就是確保我們在排的時候裡面還是在相交之前。而pivot = divide_and_swap(a, left, right);這一行在做的就是我們從左區間left到右區間right中做排列,抽出left這個位置的value當做基準值pivot,然後讓左邊的值都比pivot小,讓右邊的值都比pivot大,最後再返回pivot的位置。

   do {
      // find out l which the element is bigger/equal than
      // pivot from left hand side
      do l++; while (a[l] < pivot);
      // find out r which the element is less/equal than
      // pivot from right hand side
      do r--; while (a[r] > pivot);
      if (l < r) swap (a+l, a+r);
   } while (l < r);

   a[left] = a[r];
   a[r] = pivot;
那麼經過do while迴圈後pivot左邊的那群value將會小於等於pivot,右邊的將會大於等於pivot。

2013年7月20日 星期六

shell sorting的研究和改進

理論上來說shell 是insertion的改進版。但究竟能產生多少的差別呢?
首先我使用100,000個elements的random array,range是100,000。

timing for bubble: 40.000000
timing for big one: 12.000000
timing for insertion: 9.000000
timing for insertion(with link list): 48.000000
timing for shell: 0.000000

似乎看不到有什麼差別阿,於是這次就使用400,000個elements,random range400,000。
timing for bubble: 592.000000
timing for big one: 200.000000
timing for insertion: 120.000000
timing for insertion(with link list): 1212.000000
timing for shell: 0.000000

唔,當其他的演算法已經開始以分鐘來計時的時候,我們仍然看不到shell的底線到底在哪裡。而其他的演算法果然是大約是以O(N^2)來增加時間複雜度。當然比較麻煩的就是insertion with link list這種很吃記憶體和cache的memory bandwidth就已經不是用單純的演算法來估計了。還必須加上這種memory transferring bound的問題。

因此一口氣催下去看看shell的底線在哪吧!增加個20倍:8000,000個elements, range 8000,000:
timing for shell: 4.000000


所以用時間複雜度來單純估計insertion,timing大約會是120*20^2  =48000
speed up大約是:48000/4=12000倍....差太多了。

至於shell有沒有可以改進的方法。也許有,比如他的kernel不要用insertion,可以改用其他的。但目前為止最快的方式還是insertion。如果可以的話,等到介紹quick sorting的時候試試看把quick sorting當kernel來嘗試shell sorting。

timing for shell: 5

timing for shell(3*d +1):36
timing for shell(3*d +2): 47

的確目前看起來d=3*d+1是最快的方式 。
timing for shell:??


於是把code裡面的unsigned d換成是long int d 再跑一次d=7*d+3
timing for shell(7*d+3):67


timing for shell(d=7*d+1): 32.000000
timing for shell(d=7*d+2): 31.000000
timing for shell(d=7*d+3): 32.000000
timing for shell(d=7*d+4): 33.000000
timing for shell(d=7*d+5): 35.000000
timing for shell(d=7*d+6): 33.000000
timing for shell(d=6*d+1): 27.000000
timing for shell(d=6*d+2): 231.000000
timing for shell(d=6*d+3): 217.000000
timing for shell(d=6*d+4): 233.000000
timing for shell(d=6*d+5): 29.000000
timing for shell(d=5*d+1): 26.000000
timing for shell(d=5*d+2): 27.000000
timing for shell(d=5*d+3): 29.000000
timing for shell(d=5*d+4): 28.000000
timing for shell(d=4*d+1): 27.000000
timing for shell(d=4*d+2): 233.000000
timing for shell(d=4*d+3): 29.000000
timing for shell(d=3*d+1): 24.000000
timing for shell(d=3*d+2): 22.000000
timing for shell(d=2*d+1): 26.000000


舉例:d=6*d+3 當d=9以及d=2073的時候他們剛好是可以整除的倍數關係。那麼當我們排到d=9的時候事實上就等於d=2073也順便排一次了。那麼等於2073那次其實是多餘的排列。


因此測試我的理論是否是正確的就是測看看這種case: d=5*d 以及比較d=5*d+1, d= 5*d+2....的速度上的比較。我預估d=5*d會是相當劇烈的慢的。但由於我相當的相信我的理論是對的所以就懶的測試了。有興趣的人可以去玩玩看!

2013年7月17日 星期三

shell sorting

// shell sort
void shell_sort(int *a, int size)
   // the element that want to insert in
   unsigned sofar;
   // previous element index before sofar
   int prev;
   // saving the value of a[sofar]
   int a_sofar;
   unsigned d = 1;
   // find out d_{n+1} < size
   do {
      d = 3*d + 1;
   } while (d < size);
   d = (d - 1)/3;
   d = (d - 1)/3;

   // use insertion sort until division distance = 1
   do {
      for (sofar = d; sofar < size; ++sofar) {
         // save a[sofar]
         a_sofar = a[sofar];
         // previous index start from sofar - 1
         prev = sofar - d;
         // while previous element is larger then
         // the value that we want to insert, then
         // push it to the right hand side
         while (prev >= 0 && a[prev] > a_sofar) {
            a[prev + d] = a[prev];
            prev -= d;
         // then a[prev] is small or equal than a_sofar
         // so we can insert a[sofar] to this position
         a[prev + d] = a_sofar;
      }/* sofar */
      d = (d - 1)/3;
   } while (d >= 1);

以上是Shell sorting的程式碼,基本上他算是insertion sorting的延伸。你可以想像一列身高沒有排好的隊伍,原先的insertion sorting就是從頭開始一個一個的去排,把後面那個依據身高來往前

而insertion sorting的缺點就是如同bubble sorting一樣,資料量越大的話那麼會有兩個要素就會跟著變大1.比較次數,2.資料搬移次數。只是insertion 比傳統的bubble sorting好一點的地方就是insertion的期望比較次數和資料搬移次數會是當下已排序量的一半。因此bubble sorting比較搬移次數如果是大約O(N^2)那麼insertion會是這個期望值的一半(雖然如此但成長倍數仍然是N^2)。

那麼如果本身資料已經有些排序的話,基本上insertion比較次數會比較少。因此藉由這樣的想法而發展出所謂的shell sorting。

他的邏輯很簡單。首先我給它一個number d 假設他是10好了。具體的作法如下:
4.直到從第9位開始數已經排序完之後,我們就縮短d,比如8 或7 或其他更小的數。
5.d越來越小直到d=1的時候就等於是普通的insertion sorting了。

而有人做演算法實驗發現如果d_{i+1}= 3*d_i +1的這種方式來算組距,當一開始d_n如果滿足d_{n+2} <N的時候,大量資料的情況之下是最理想的,時間複雜度將會到O(N^1.25)


前面的sofar,a_sofar,prev和Insertion sorting的notation用的是一樣的,sofar意思是目前排序的位置,也就是待排序數。a_sofar就是a[sofar],prev就是在sofar之前的index。

   unsigned d = 1;
   // find out d_{n+1} < size
   do {
      d = 3*d + 1;
   } while (d < size);
   d = (d - 1)/3;
   d = (d - 1)/3;
在這邊一開始當然設的組距d是1,因為畢竟最後就是要做insertion sorting,而按照最佳的測試。d=3*d+1,當d_n滿足d_{n+2}<N的時候就是最好狀況。因此這邊首先d=1是因為最後要做的是insertion,而中間那個do while回圈就是要先找到d_n<N的狀況。接著往回回溯兩次就會是這個d_{n+2}<N了。

      for (sofar = d; sofar < size; ++sofar) {
         // save a[sofar]
         a_sofar = a[sofar];
         // previous index start from sofar - 1
         prev = sofar - d;
         // while previous element is larger then
         // the value that we want to insert, then
         // push it to the right hand side
         while (prev >= 0 && a[prev] > a_sofar) {
            a[prev + d] = a[prev];
            prev -= d;
         // then a[prev] is small or equal than a_sofar
         // so we can insert a[sofar] to this position
         a[prev + d] = a_sofar;
      }/* sofar */
這個很熟悉嗎?是的沒錯,這就是普通的insertion sorting。只是它是每間隔d開始做一次sorting。首先為了教學方便我們先假設d=10。於是我們先從隊伍中第十個人開始與前面每隔10個人就抽出來的人開始做insertion排序。當然在這邊就只有第一個人跟他做insertion排序。這兩個人排好之後就換第11個!注意這邊的邏輯會有點不太一樣。理論上來說是從隊伍的第20個開始跟原先這兩個排序好的傢伙再次排序,接著是第30,40,50... 最後才是從隊伍的第十一個開始與第二個人開始作排序,接著是第二十一個與第十一個,第二個人排序。如此下來的。但這邊的方式是不太一樣的。但基本上演算方式其實是和我們一開始的設計是一樣的,只是這邊的順序就是有經過調整。但是最後的排序方式都會是和我們的策略是一模一樣的。


   do {
      d = (d - 1)/3;
   } while (d >= 1);
慢慢的縮小組距d,直到最後d=1做普通的一般insertion sorting為止。這就是shell sorting。基本上就是insertion sorting,只是是有組距版本的。

2013年7月15日 星期一

insertion sort 的研究和改進


<次數>=sum_某數 (某數次數*某數機率)



而解決第一個問題的方式很簡單,就是使用link list的資料結構,這樣就不需要在那一個一個搬移資料,直接插入值就行了。 
而我們由於在這篇文章: 排序前的準備 已經老早就有現成的link list可以用了,所以不用在那煩惱怎麼把array轉成link list


以下是使用Link list的方法來解決搬移次數的問題:
void insertion_sort_use_LL(int *a)
   data_node *sofar, *rush, *b4_sofar, *smaller;
   int val_sofar;
  // previous node of sofar
   b4_sofar = head;
   // begin sofar at the 2nd node
   sofar = head->next;

   // run over all elements
   while (sofar != NULL) {
      val_sofar = sofar->data;
      // compare val_sofar from head to sofar
      smaller = rush = head;
      while (rush != sofar && rush->data <= val_sofar) {
         // if data  of rush is smaller than val_sofar,
         // move to the next element
         smaller = rush;
         rush = rush->next;
      // if sofar is in order, then go to next and continue
      if (rush == sofar) {
         b4_sofar = b4_sofar->next;
         sofar = sofar->next;
      // de-link of sofar
      b4_sofar->next = sofar->next;
      // insert sofar between smaller and rush
      sofar->next = rush;
      // if sofar is the smallest, then put
      // it to head, else put it after smaller
      if (rush == head)
         head = sofar;
         smaller->next = sofar;
      // go to next sofar
      sofar = b4_sofar->next;
   }/* sofar */

   // put the result back to array
由於link list還尚未介紹,但如果你了解link list那便足夠了解這部分的程式邏輯。
  while (sofar != NULL)

就如同我們在普通insertion_sort一樣,sofar是從第2個node開始直到最後。而由於我們一開始程式的link list的tail node接的是NULL,因此我們便用這個方式判斷sofar是不是跑到結尾了。

      while (rush != sofar && rush->data <= val_sofar) {
         // if data  of rush is smaller than val_sofar,
         // move to the next element
         smaller = rush;
         rush = rush->next;

1. rush等於sofar這個pointer跳出迴圈,意思是sofar比前面的都還要大。那麼我們不需要insert sofar, 直接往下一個node邁進,因此在這迴圈底下就會接了一個判斷式:

      if (rush == sofar) {
         b4_sofar = b4_sofar->next;
         sofar = sofar->next;

     b4_sofar->next = sofar->next;

     sofar->next = rush;
接著把smaller的尾巴接到sofar上,但如果sofar是最小的點的話,那麼smaller會=rush也就是上面這個while的迴圈連跑都沒有跑,因此這時候sofar就會是這個link list的頭。最後我們朝向下一個sofar前進:
      if (rush == head)
         head = sofar;
         smaller->next = sofar;
      // go to next sofar
      sofar = b4_sofar->next;
最後整個迴圈過後我們在運用早已寫好的 list_to_arry(a);把link list放回array。

但是我個人的猜測是,使用Link List的方式其實效率會比原先的方式差。而且沒錯的話應該會差蠻多的。先不跑測試的話,光用分析的方式,我們會發現在找出資料該插入適合的位置的時候,是採取一個node 一個node去trace。她不像是array在記憶體編排上是連續的形式,反而是分散的狀況,每個node和每個node之間其實是不連續的。

我們來看普通的link list 的node的資料結構是:
typedef struct data_node {
   int data;
   struct data_node *next;

1. 首先我們需要找出pointer內資料放的address。
2. 從這address中去記憶體提領next這個pointer內的資料,裡面包含了data以及一個pointer。

這樣子會造成什麼樣的問題呢?主要是cache miss的問題,由於每個node放在記憶體中的位置很可能不是連續的,因此cache update的時候從記憶體抓資料的時候很有可能都不會抓到next的node,那麼這樣子下來每次迴圈要跑下一個node的時候,cpu每次就得要等從memory拿資料到cache上,而不是像一般insertion的方法,幾乎資料都是一次抓一把到cache的slot中,使用array能夠有效利用cache update的優勢,即使要搬移資料其實也只需要在cache上搬移而已。因此單從計算的角度看起來,效率非常有差別。

以下是使用了60000個elements的random array, range:[0:1000]的測試結果:
timing for insertion: 4 secs
timing for insertion using link list: 13 secs

timing for insertion: 4 secs
timing for insertion using link list: 13 secs

因此預測應該是沒錯的 。雖然link list的方法大大減免了資料搬移的動作,但是畢竟memory bandwidth還是不可能跟得上cpu本身的運算時脈,cache miss的問題還是最能左右結果。因此作演算法的時間複雜度分析其實不能做很簡單的推測,主軸還是要先對硬體的特性有基本的了解才去分析才有真正的意義。

2013年7月12日 星期五

Insertion sort

// insertion sorting
void insertion_sort(int *a, int size)
   // the element that want to insert in
   unsigned sofar;
   // elements before sofar
   int prev;
   // saving the value of a[sofar]
   int a_sofar;

   // insertion for each elements
   for (sofar = 1; sofar < size; ++sofar) {
      // save the value of a[sofar]
      a_sofar = a[sofar];
      // previous index start from sofar - 1
      prev = sofar - 1;
      // while previous element is larger then
      // the value that we want to insert, then
      // push it to the right hand side
      while (prev >= 0 && a[prev] > a_sofar) {
         a[prev + 1] = a[prev];
      // then a[prev] is smaller or equal than a_sofar
      // so we can insert a[sofar] to this position
      a[prev+1] = a_sofar;
   }/* sofar */




首先我們把第二個人叫出來,於是你可以看到這個for loop是從這個隊伍的第二個人開始,然後在裡面持續的做身高的比較,直到最後的那個人也比較過:
   for (sofar = 1; sofar < size; ++sofar) {

     a_sofar = a[sofar];

      prev = sofar - 1;
      while (prev >= 0 && a[prev] > a_sofar) {
         a[prev + 1] = a[prev];
請注意這邊的比較迴圈有個先決條件就是前面的人不是幽靈(prev >= 0 )因為隊伍是從第0個開始排的,並沒有第-1個第-2個...所以我們設了這樣的條件,防止prev--會跑到幽靈人物那邊去。

      a[prev+1] = a_sofar;
會跳出while比較迴圈並執行 a[prev+1] = a_sofar;只有三種情形:
 1. 一開始帥哥就比前面的還高,所以while不執行,直接執行 a[prev+1] = a_sofar;也就是帥哥被塞回去

2. 帥哥的身高中等,於是依他的身高前後都有人,那麼必然是因為while迴圈比較到一半發現他不符合a[prev] > a_sofar 因此執行了a[prev+1] = a_sofar; 所以prev這個人比帥哥矮或一樣,他沒有往後退,而prev+1這個位置原本的人因為比帥哥高,所以早就已經往後退了,因此這個prev+1的位置是空的,帥哥塞到這個位置是沒錯的。

3. 帥哥是最矮的,因此他是因為while迴圈發現了不符合prev >= 0(也就是prev = -1)了,所以該跳出迴圈去執行a[prev+1] = a_sofar; 那麼這時候a[prev+1] = a[0] 理所當然的帥哥應當順理成章的當目前最矮的傢伙。

bubble sort的研究和改進

在看這個文章之前,請回去看bubble sort中關於surface是什麼意思
關於bubble sort有個麻煩的地方就在於如果是一般任意的資料形式, 它swap的次數非常的多。

12 3 7 8 8 15 89
3 7 8 8 12 15 89

是的 這種情況有可能發生, 但在資料很多的狀況之下省掉的swap的量根本沒有很多。 因為每次都一樣會從第0個element開始做sorting,在直到surface之前都會swap好幾次。
第一次sorting的機率也許是一半 0.5 ,假設有1000個element,

這是我用1000個random number (mod 100) 的array去測量swap次數的結果:
swap次數 = 241946
如果這些random number是mod 1000:
swap次數 = 254648


因此這swap的次數太過驚人了,swap要傳入兩個arguements,做了兩次copy reference的運算,再加上三個assignment的運算,雖然乍看之下不少,但swap本身的次數是非常多的!等於是有24萬次的swap運算。 先不看copy reference的運算次數,光看那assignment的運算有三次的話,總共的次數會有72萬次基本assignment運算!

等於光看這樣的結果的話,資料每多一個order, swap的次數就多了兩個order,也就是swap的次數是資料量N的平方倍 O(N^2)

個人在分析了這麼誇張的狀況之下,想了一下, 根本這個bubble sorting對於處理量不小的資料是有非常多餘沒有任何意義的運算。因為在找出最大的value之前,我們根本不用在那邊跟小嘍囉周旋!了解嗎?我們只是要直接找出最大的老大是誰,不需要一個一個小嘍囉在那瘋狂的swap。

因此以這樣的想法去想的話,我們在每次surface decrease之前其實只需要做一次swap就可以了,也就是找出最大的那個,然後跟surface那個position swap就好了。 因此這樣一來swap的次數就會等同於資料量的大小。

void big_one_sort(int *a, int size)

   // mark the index of the largest value
   unsigned max_ind;
   // mark the largest value
   int max_val;

   unsigned i, surface;
   for (surface = size - 1; surface > 0; --surface) {
      // regard the last one as the max value
      max_ind = surface;
      max_val = a[max_ind];
      // find out the max value and index
      for (i = 0; i < surface; ++i)
         if (a[i] > max_val) {
            max_val = a[i];
            max_ind = i;
      // swap the last one with max one
      swap(a + surface, a + max_ind);
   }/* surface */

基本上程式碼和bubble sort是差不多的,只是多了兩個量:
max_val 是為了記錄在某次sorting下的最大值,
因此當內圈的i loop跑完之後,我們便會找到除了surface這個element之前的最大的value和其位置
接著我們就直接swap surface的value和max_val 也就是最大的那個值和surface交換

當然也許會問,為什麼i loop不要檢視到surface這個值? 理由在於:我們在i loop之前便已經把
max指定為surface那個值,也就是假定最後的那個是最大的。 接著我們在i loop之後就直接swap最後的那個以及最大的值, 因此會有兩個情形發生:
1. 找到的max_val比surface那個值還大, 那麼swap是沒什麼問題。
2. 找到的max_val比surface那個值還小, 那麼surface無疑就是最大的, 它和它自己swap沒什麼不好,當然也許多餘,但數學上是一樣的 (而且就數學機率上來說這個swap發生的機率= 1/surface 微乎其微)

而且最重要的是如果我們的for loop有檢視到surface,等於是我們至少會多一次運算,就是裡面的那個 if (a[i] > max_val)
這是無可避免的,但是如果我們的for loop並沒有到surface的話,我們少了這次運算,而且那個swap不管是哪種方案也照樣會去執行。
沒有任何理由去把這for loop跑到surface去。


因此最後比較這兩個速度的話...我用time.h的time函數去跑80000這樣大小的random array 速度上
big_one_sort會是bubble_sort的 33/9 = 366.67% 倍, 當然隨著資料量越多,這個差距會更加的恐怖。

2013年7月11日 星期四

bubble sort

// bubble sorting
void bubble_sort(int *a, int size)
   int i, surface;
   //surface for putting the largest value after sorting for i loop
   for (surface = size - 1; surface > 0; --surface)
      // sorting like bubble, compare then and
      // switch them if larger bubble is on the left
      // hand side(a[i]), and finally we will get
      // the largest value
      for (i = 0; i < surface; ++i)
         if (a[i] > a[i+1])
            swap(a + i, a + i + 1);

// swap two values
void swap(int *a, int *b)
   int tmp = *a;
   *a = *b;
   *b = tmp;
程式請直接放入這支程式的 int main()上方,接著在那支程式的"func"的位置下面放上
   bubble_sort(b, arry_size);
   printf("The result of bubble sort:\n");
   for (i = 0; i < arry_size; ++i)
      printf("%d ", b[i]);

Bubble sort的演算法的基本原理就像是水中的泡沫一般,比較大的泡沫會不斷的往上爬.我們從最下面的那一個泡沫開始, 如果他比上面的那一個大顆,那麼就讓它往上爬,如果遇到同樣大顆或是比它大顆的,那麼就請留在原地,接著我們就用同樣方式繼續檢視它上面那顆,直到表層. 在code裡面我把水的表層取名叫surface. 這個code其實非常的短, 我們先來從最重要的部份開始講起.
      for (i = 0; i < surface; ++i)
         if (a[i] > a[i+1])
            swap(a + i, a + i + 1);
這個部分是bubble sort的主要原理部分, swap就是直接交換這兩個放入指標的值. 這個迴圈就是從泡泡的最底層一個一個去檢視泡泡的大小a[i]以及a[i+1], 如果底下那顆a[i]比上面那顆a[i+1]大顆,那麼就交換它們的位置,可以把它想成大顆的泡泡往上擠,硬把上面那顆小顆的往下壓. 當然遇到比他塊頭一樣或更大的(a[i] <= a[i+1])就不擠了,當然檢視一樣沒有中斷,就繼續檢視上面這顆,讓他繼續往上擠,照著這樣的方式我們就會檢視到水面,也就是surface這邊了. 

因此照這樣的想法來看的話,我們在這次檢視過後,到最後在水面的必然就是這次檢視中最大顆的,要強調的就是"這次檢視". 因為我們會有好幾次檢視. 所以跑完第一次surface迴圈,我們找到最大顆的並且她因為不斷的往上擠的緣故所以跑到了表層,也就是這個array的最右邊. 接下來的迴圈
   for (surface = size - 1; surface > 0; --surface)
就是把水面往下壓, 因為這次檢視中最大顆的已經跑出水面了, 我們就沒必要再次的去比較它, 我們只需要比較水面底下剩下的那些小嘍囉, 因此就是把水面往下壓,直到剩下那顆泡泡(surface > 0) 至於為什麼不要(surface >= 0)的原因就是因為剩下的那顆理所當然的就是最小的,沒有必要再去比較了. 

因此這個程式到最後array最右邊的就會是最大顆的,接著它的左邊那個就會是第二次檢視中最大顆的,那麼問題來了, 這左邊那顆會比右邊那顆還大嗎? 答案是不會, 因為我們在第一次檢視中選取的就會是最大顆的,不要忘記,最先冒出水面的當然是最大顆的. 因此接著之後冒出來的都必然會相等或是更小,不會更大. 

至於swap這支程式就不多做敘述了, 不在資料結構這邊討論的範疇,這是C語言的pointer, 有興趣的人請自行google pointer以及function的關聯. 基本上這支swap程式就是交換傳入的兩個value而已.


這邊使用了link list是為了能夠動態儲存使用者資料
原因在於我們不能預知使用者到底會輸入多少資料, 當然我們也可以使用c++的vector之類的東西, 只是在此並沒有使用.
而動態儲存至link list之後把它轉成array方便做sorting.
如果不曉得link list之後會介紹,在此只需要把程式碼直接copy過去即可.

#include <stdio.h>
#include <stdlib.h>

// structure for link list
typedef struct data_node {
   int data;                    // save data
   struct data_node *next;      // next node
} data_node;

// declare head and tail node pointer
data_node *head, *tail;

// save the data to the tail of the link list
void put_to_tail(int d)
   // create a node with data value d
   data_node *node;
   node = (data_node*) malloc(sizeof(data_node));
   node->data = d;

   node->next = NULL; // no follower

   // if this is the first node
   if (head == NULL)
      // then this one is head and also tail
      head = tail = node;
   else { // if there are existing nodes
      // then put that node to the last position
      tail->next = node;
      tail = node;

// show each elements of the link list
// and return the number of the elements
unsigned show_list_and_size(void)
   if (head == tail)
      error_msg("please put in values");
   // number of the elements of the link list
   unsigned num = 0;
   printf("data list is the following:\n");

   // explorer of the list
   data_node *rush, *prev;
   // beginning position
   rush = head;
   // if it is not the end
   while (rush != NULL) {
      // then continue to explore
      // keep the previous position
      prev = rush;
      // explore the next node
      rush = rush->next;
      // print out the data
      printf("%d ", prev->data);
      // accumulate the number
   // return the number of the elements
   return num;

// put the data from the link list to array a
void list_to_arry(int *a)
   data_node *rush, *prev;

   // beginning position
   rush = head;
   // array index start from 0
   unsigned i = 0;

   // if it is not the end
   while (rush != NULL) {
      // then continue to explore
      // keep the previous position
      prev = rush;
      // put that data to the arrary
      a[i++] = prev->data;      
      // explore the next node
      rush = rush->next;

// print out the error message
void error_msg(char *msg)
   fprintf(stderr, "%s\n", msg);

int main(void)
   // initialize head and tail as NULL
   head = NULL;
   tail = NULL;

   printf("Enter the numbers:");
   int data;

   // if user is still input the data,
   // then put it to the tail of the link list
   while (scanf("%d", &data) != EOF)

   // show all the elements and get the size
   unsigned arry_size = show_list_and_size();

   // allocate the arrary
   int *a = (int*) malloc(sizeof(int) * arry_size);
   // put the data from the list to that array

   // allocate another array for showing the sorted result
   int *b = (int*) malloc(sizeof(int) * arry_size);
   int i;

   // initilize it as the original array
   for (i = 0; i < arry_size; ++i)
      b[i] = a[i];
   //        func               //


   return 0;