FC2カウンター FPGAの部屋 hls::LineBufferとhls::Windowでラプラシアンフィルタを実装する1

FPGAやCPLDの話題やFPGA用のツールの話題などです。 マニアックです。 日記も書きます。

FPGAの部屋

FPGAの部屋の有用と思われるコンテンツのまとめサイトを作りました。Xilinx ISEの初心者の方には、FPGAリテラシーおよびチュートリアルのページをお勧めいたします。

hls::LineBufferとhls::Windowでラプラシアンフィルタを実装する1

あるところから hls::LineBuffer と hls::Window を教えて頂いたので、それを使ってラプラシアンフィルタを実装してみました。

hls::LineBuffer と hls::Window は、HLS ビデオライブラリの1部のようだ。詳細は、”Vivado Design Suite ユーザー ガイド 高位合成 UG902 (v2015.4) 2015 年 11 月 24 日”の 192 ページからに書いてある。

ラインバッファや n x n の行列(メモリ・ウインドウ・バッファ)を表すための C++ のクラスのようだ。つまり、今までコードを書いてラインバッファにしてきたが、それ専用のライブラリを使って実装してみよう。
これらは、193ページの”表 2‐7 : LineBuffer 例のデー タ セッ ト”に示される様に、3 行のラインバッファだと、行2が一番上になる。193ページの表 2‐7 を引用する。
LineBuffer_Window_1_160317.png

最初の lap_filter_axim_lb.cpp を示す。ユーザーズガイドが間違っているようだ。該当する列のラインバッファの内容を1つ上にあげて、一番下にデータを入れるメソッドは、shift_down(x) と insert_bottom(pix, x) のようだ。

// lap_filter_axim_lb.cpp
// m_axi offset=slave Version
// 2016/03/12 : hls::LineBuffer, hls::Window を使用した
//

#include <stdio.h>
#include <string.h>
#include <hls_video.h>

#define HORIZONTAL_PIXEL_WIDTH    64
#define VERTICAL_PIXEL_WIDTH    48
//#define HORIZONTAL_PIXEL_WIDTH    800
//#define VERTICAL_PIXEL_WIDTH    600

#define ALL_PIXEL_VALUE    (HORIZONTAL_PIXEL_WIDTH*VERTICAL_PIXEL_WIDTH)

int conv_rgb2y(int rgb);

int lap_filter_axim(volatile int *cam_fb, volatile int *lap_fb)
{
    #pragma HLS INTERFACE s_axilite port=return

#pragma HLS INTERFACE m_axi depth=3072 port=cam_fb offset=slave bundle=cam_fb
#pragma HLS INTERFACE m_axi depth=3072 port=lap_fb offset=slave bundle=lap_fb

    hls::LineBuffer<2, HORIZONTAL_PIXEL_WIDTH, int> linebuf;
    hls::Window<33int> mbuf;
    int x, y;
    int val;
    int t_val;
    int i, j;
    const int lap_weight[3][3] = {{-1, -1, -1},{-18, -1},{-1, -1, -1}};
#pragma HLS ARRAY_PARTITION variable=lap_weight complete dim=0
    int pix;

    // RGB値をY(輝度成分)のみに変換し、ラプラシアンフィルタを掛けた。
    for (y=0; y<VERTICAL_PIXEL_WIDTH; y++){
       for (x=0; x<HORIZONTAL_PIXEL_WIDTH; x++){
            // 1ピクセル読み出し
            pix = cam_fb[y*HORIZONTAL_PIXEL_WIDTH+x];

            mbuf.shift_left();    // mbuf の列を1ビット左シフト
            mbuf.insert(linebuf(1,x), 22);
            mbuf.insert(linebuf(0,x), 12);
            mbuf.insert(pix, 02);

            // LineBuffer の更新
            linebuf.shift_down(x);
            linebuf.insert_bottom(pix, x);

            // ラプラシアンフィルタの演算
            for (j=0, val=0; j<3; j++){
                for (i=0; i<3; i++){
                    t_val = mbuf(2-j,i);
                    val += lap_weight[j][i] * conv_rgb2y(t_val);
                }
            }
            if (val<0// 飽和演算
                val = 0;
            else if (val>255)
                val = 255;

            // ラプラシアンフィルタ・データの書き込み
            if (x>1 && y>1)
                lap_fb[y*HORIZONTAL_PIXEL_WIDTH+x] = (val<<16)+(val<<8)+val ;
            else
                // x<2 || y<2 の場合はピクセルデータがまだ揃っていないので0にする
                lap_fb[y*HORIZONTAL_PIXEL_WIDTH+x] = 0;
            // printf("x = %d  y = %d", x, y);
        }
     }
     return(0);
}

// RGBからYへの変換
// RGBのフォーマットは、{8'd0, R(8bits), G(8bits), B(8bits)}, 1pixel = 32bits
// 輝度信号Yのみに変換する。変換式は、Y =  0.299R + 0.587G + 0.114B
// "YUVフォーマット及び YUV<->RGB変換"を参考にした。http://vision.kuee.kyoto-u.ac.jp/~hiroaki/firewire/yuv.html
// 2013/09/27 : float を止めて、すべてint にした
int conv_rgb2y(int rgb){
    int r, g, b, y_f;
    int y;

    b = rgb & 0xff;
    g = (rgb>>8) & 0xff;
    r = (rgb>>16) & 0xff;

    y_f = 77*r + 150*g + 29*b; //y_f = 0.299*r + 0.587*g + 0.114*b;の係数に256倍した
    y = y_f >> 8// 256で割る

    return(y);
}


なお、

int colbuf[3];
#pragma HLS ARRAY_PARTITION variable=colbuf complete dim=1

を定義して、for 文の中を以下の通りに書き換えても同様の動作となった。

    for (y=0; y<VERTICAL_PIXEL_WIDTH; y++){
        for (x=0; x<HORIZONTAL_PIXEL_WIDTH; x++){
            // 1ピクセル読み出し
            pix = cam_fb[y*HORIZONTAL_PIXEL_WIDTH+x];

            // colbuf[] にラインバッファと読みだしたピクセルを入れる
            colbuf[2] = linebuf(1,x);
            colbuf[1] = linebuf(0,x);
            colbuf[0] = pix;

            mbuf.shift_left();    // mbuf の列を1ビット左シフト
            mbuf.insert_left(colbuf);    // mbuf の列に colbuf[] を代入

            // LineBuffer の更新
            linebuf.shift_down(x);
            linebuf.insert_bottom(pix, x);

            // ラプラシアンフィルタの演算
            for (j=0, val=0; j<3; j++){
                for (i=0; i<3; i++){
                    t_val = mbuf(2-j,i);
                    val += lap_weight[j][i] * conv_rgb2y(t_val);
                }
            }
            if (val<0// 飽和演算
                val = 0;
            else if (val>255)
                val = 255;

            // ラプラシアンフィルタ・データの書き込み
            if (x>1 && y>1)
                lap_fb[y*HORIZONTAL_PIXEL_WIDTH+x] = (val<<16)+(val<<8)+val ;
            else
                // x<2 || y<2 の場合はピクセルデータがまだ揃っていないので0にする
                lap_fb[y*HORIZONTAL_PIXEL_WIDTH+x] = 0;
            // printf("x = %d  y = %d", x, y);
        }
     }


これをHDLへ合成した時の結果を下に示す。
LineBuffer_Window_2_160317.png
LineBuffer_Window_3_160317.png

Analysys表示を下に示す。
LineBuffer_Window_4_160317.png

C20までステートがあった。

次に、C/RLTコシミュレーションを行った。
LineBuffer_Window_6_160317.png

シミュレーション終了までに、243,790 クロックかかったようだ。

Open Wave Viewer... ボタンをクリックして波形を表示した。
LineBuffer_Window_7_160317.png

拡大してみてみると、cam_fb の Read は64 バーストで Read するが、lap_fb の Write は シングル転送になっていることが分かる。
LineBuffer_Window_8_160317.png

なお、テストベンチは、”Vivado hls勉強会4(axi4 master)”と同様に 64 x 48 ピクセルの 'A' の画像のラプラシアンフィルタ処理をするテストベンチです。但し、ラプラシアンフィルタの処理ルーチンが最初の行、列の2ピクセル分を黒にしているバージョンになっています。
  1. 2016年03月15日 05:03 |
  2. Vivado HLS
  3. | トラックバック:0
  4. | コメント:0

コメント

コメントの投稿


管理者にだけ表示を許可する

トラックバック URL
http://marsee101.blog19.fc2.com/tb.php/3418-750f672a
この記事にトラックバックする(FC2ブログユーザー)