中文字幕免费精品_亚洲视频自拍_亚洲综合国产激情另类一区_色综合咪咪久久

oracle并行操作之并行查詢實例解析
來源:易賢網 閱讀:1046 次 日期:2016-06-24 09:23:06
溫馨提示:易賢網小編為您整理了“oracle并行操作之并行查詢實例解析”,方便廣大網友查閱!

這篇文章主要介紹了oracle并行操作的并行查詢技術,需要的朋友可以參考下。

oracle數據庫的并行操作特性,其本質上就是強行榨取除數據庫服務器空閑資源(主要是cpu資源),對一些高負荷大數據量數據進行分治處理。并行操作是一種非確定性的優化策略,在選擇的時候需要小心對待。目前,使用并行操作特性的主要有下面幾個方面:

parallel query:并行查詢,使用多個操作系統級別的server process來同時完成一個sql查詢;

parallel dml:并行dml操作。類似于parallel query。當要對大數據量表進行dml操作,如insert、update和delete的時候,可以考慮使用;

parallel ddl:并行ddl操作。如進行大容量數據表構建、索引rebuild等操作;

parallel recovery,并行恢復。當數據庫實例崩潰重新啟動,或者進行存儲介質恢復的時候,可以啟動并行恢復技術。從而達到減少恢復時間的目的;

procedural parallel,過程代碼并行化。對我們編寫的代碼片段、存儲過程或者函數,可以實現執行的并行化,從而加快執行效率;

1、并行查詢parallel query

oracle數據庫的并行查詢是比較基礎的技術,也是olap和oracle data warehouse經常使用的一種并行技術。同本系列前面一直強調的要素相同,在確定使用并行技術之前,要確定軟硬件的一些先決條件:

任務task必要條件。備選進行并行操作的任務task必須是一個大任務作業,比如,長時間的查詢。任務時間通常可以以分鐘、小時進行計數。只有這樣的任務和需要,才值得讓我們冒險使用并行操作方案;

資源閑置條件。只有在數據庫服務器資源存在閑置的時候,才可以考慮進行并行處理。如果經常性的繁忙,貿然使用并行只能加劇資源的爭用。

并行操作最大的風險在于并行爭用引起的效率不升反降。所以,要在確定兩個前提之后,再進行并行規劃處理。

2、環境準備

首先,準備實驗環境。由于筆者使用的一般家用pc虛擬機,所以并行度和存儲量不能反映真實條件需求,見諒。

sql> select * from v$version where rownum<2;

banner

--------------------------------------------------------------------------------

oracle database 11g enterprise edition release 11.2.0.1.0 - production

sql> select count(*) from t;

count(*)

----------

1160704

選擇11gr2服務器環境,數據表t總數據量超過一百萬。

首先,我們觀察一下不使用并行的執行情況。

//提取出使用游標信息;

sql> select sql_text, sql_id, version_count from v$sqlarea where sql_text like 'select count(*) from t%';

sql_text            sql_id    version_count

------------------------------ ------------- -------------

select count(*) from t     2jkn7rpsbj64t       2

sql> select * from table(dbms_xplan.display_cursor('2jkn7rpsbj64t',format => 'advanced', cursor_child_no => 0));

plan_table_output

--------------------------------------------------------------------------------

sql_id 2jkn7rpsbj64t, child number 0

-------------------------------------

select count(*) from t

plan hash value: 2966233522

-------------------------------------------------------------------

| id | operation     | name | rows | cost (%cpu)| time   |

-------------------------------------------------------------------

|  0 | select statement  |   |    | 4464 (100)|     |

|  1 | sort aggregate  |   |   1 |      |     |

|  2 |  table access full| t  | 1160k| 4464  (1)| 00:00:54 |

-------------------------------------------------------------------

該執行計劃中沒有使用并行特性,進行全表掃描。執行時間為54s。

3、并行查詢計劃

首先,我們設置相應的并行度。設置并行度有兩種方式,一種是使用hint加在特定的sql語句上。另一種是對大對象設置并行度屬性。

前者的優點是帶有一定的強制性和針對性。就是指定特定的sql語句進行并行處理。這樣的優點是易于控制并行度,缺點是帶有很強的強制力,當數據量偏小的時候,使用并行優勢不大。而且如果是顯示指定并行度,又會帶來移植伸縮性差的缺點。

后者通過對象的屬性指定并行度。就將并行作為一種執行手段,提供給優化器進行選擇。這樣,cbo會根據系統中資源的情況和數據的實際,進行執行計劃生成。計劃中可能是并行,也可能不是并行。這樣的優點是將并行與否交予優化器cbo去判斷,缺點是并行的濫用風險。

此處,筆者設置自動確定并行度的方式。

sql> alter table t parallel;

table altered

sql> select count(*) from t;

 count(*)

----------

1160704

當啟動查詢時,oracle中的并行伺候進程池會根據系統中的負荷和實際因素,確定分配出的并行進程數量。此時,我們可以通過視圖v$px_process來查看進程池中的連接信息。

sql> select * from v$px_process;

server_name status      pid spid       sid  serial#

----------- --------- ---------- ------------------------ ---------- ----------

p000    available     25 5776               

p001    available     26 5778

注意,并行伺候進程是一種特殊的server process,本質上是一種可共享的slave進程。專用連接模式下,一般的server process與client process是“同生共死”的關系,終身服務于一個client process。而伺候slave進程是通過進程池進行管理的,一旦啟動初始化,就會在一定時間內駐留在系統中,等待下次并行處理到來。

此時,我們檢查v$process視圖,也可以找到對應的信息。

sql> select * from v$process;

pid spid     pname username      serial# program   

-------- ---------- ------------------------ ----- --------------- ---------- -------------------------------

25 5776      p000 oracle         13 oracle@oracle11g (p000)  

26 5778      p001 oracle          6 oracle@oracle11g (p001)  

(篇幅由于原因,予以省略……)

32 rows selected

對應的os中,也存在相應的真實進程伺候。

[oracle@oracle11g ~]$ ps -ef | grep oracle

(篇幅由于原因,予以省略……)

oracle  5700   1 0 17:29 ?    00:00:02 oraclewilson (local=no)

oracle  5723   1 0 17:33 ?    00:00:00 ora_smco_wilson

oracle  5764   1 2 17:40 ?    00:00:05 oraclewilson (local=no)

oracle  5774   1 0 17:42 ?    00:00:00 oraclewilson (local=no)

oracle  5776   1 0 17:43 ?    00:00:00 ora_p000_wilson

oracle  5778   1 0 17:43 ?    00:00:00 ora_p001_wilson

oracle  5820   1 1 17:44 ?    00:00:00 ora_w000_wilson

由于此時查詢已經結束,對應的并行會話信息,已經消失不可見。

sql> select * from v$px_session;

saddr      sid  serial#   qcsid qcserial#

-------- ---------- ---------- ---------- ----------

但是,如果任務的時間長,是可以捕獲到對應信息的。

從上面的情況看,我們執行一個并行操作時,oracle會從伺候進程池中獲取到對應的并行進程,來進行操作。當操作完成后,伺候進程還會等待一定時間,之后回收。

并行操作進程的資源消耗,通過v$px_sysstat視圖查看。

sql> col statistic for a30;

sql> select * from v$px_process_sysstat;

statistic              value

------------------------------ ----------

servers in use             0

servers available            0

servers started             2

servers shutdown            2

servers highwater            2

servers cleaned up           0

server sessions             6

memory chunks allocated         4

memory chunks freed           0

memory chunks current          4

memory chunks hwm            4

buffers allocated           30

buffers freed             30

buffers current             0

buffers hwm               8

15 rows selected

下面,我們檢查一下執行計劃信息。

sql> set pagesize 10000;

sql> select * from table(dbms_xplan.display_cursor('2jkn7rpsbj64t',format => 'advanced',cursor_child

_no => 1));

plan_table_output

----------------------------------------------------------------------------------------------------

sql_id 2jkn7rpsbj64t, child number 1

-------------------------------------

select count(*) from t

plan hash value: 3126468333

----------------------------------------------------------------------------------------------------

| id | operation       | name   | rows | cost (%cpu)| time   |  tq |in-out| pq distrib

----------------------------------------------------------------------------------------------------

|  0 | select statement    |     |    | 2478 (100)|     |    |   |     

|  1 | sort aggregate    |     |   1 |      |     |    |   |     

|  2 |  px coordinator    |     |    |      |     |    |   |     

|  3 |  px send qc (random) | :tq10000 |   1 |      |     | q1,00 | p->s | qc (rand)

|  4 |   sort aggregate   |     |   1 |      |     | q1,00 | pcwp |     

|  5 |   px block iterator |     | 1160k| 2478  (1)| 00:00:30 | q1,00 | pcwc |     

|* 6 |    table access full| t    | 1160k| 2478  (1)| 00:00:30 | q1,00 | pcwp |     

----------------------------------------------------------------------------------------------------

predicate information (identified by operation id):

---------------------------------------------------

6 - access(:z>=:z and :z<=:z)

從執行計劃的條件(6 - access(:z>=:z and :z<=:z))中,我們可以看到任務分配,之后分別進行全表掃描。最后排序計算count,合并結果的過程。

4、結論

oracle parallel query是經常使用到的一種并行操作技術。相對于ddl、dml等類型操作,并行查詢更可以作為系統功能的一個步驟來進行。

進行并行查詢最大的風險就是并行濫用和失控的出現。這也是oracle一直致力解決的問題。在oracle11gr2中,引入了parallel statement queuing(psq)技術特性。通常,只要并行伺候池允許,oracle會引入盡可能多的并行進程進行操作。psq技術的出現,就是從資源角度加入了并行控制。

當系統繁忙的時候,psq會將一些要進行的并行操作進入等待狀態,防止并行環境的惡化。當環境好轉之后,等待隊列中的并行語句就進入執行狀態。這個特性就可以有效的防止并行濫用的出現。

更多信息請查看腳本欄目
易賢網手機網站地址:oracle并行操作之并行查詢實例解析
由于各方面情況的不斷調整與變化,易賢網提供的所有考試信息和咨詢回復僅供參考,敬請考生以權威部門公布的正式信息和咨詢為準!

2026國考·省考課程試聽報名

  • 報班類型
  • 姓名
  • 手機號
  • 驗證碼
關于我們 | 聯系我們 | 人才招聘 | 網站聲明 | 網站幫助 | 非正式的簡要咨詢 | 簡要咨詢須知 | 新媒體/短視頻平臺 | 手機站點 | 投訴建議
工業和信息化部備案號:滇ICP備2023014141號-1 云南省教育廳備案號:云教ICP備0901021 滇公網安備53010202001879號 人力資源服務許可證:(云)人服證字(2023)第0102001523號
云南網警備案專用圖標
聯系電話:0871-65099533/13759567129 獲取招聘考試信息及咨詢關注公眾號:hfpxwx
咨詢QQ:1093837350(9:00—18:00)版權所有:易賢網
云南網警報警專用圖標
主站蜘蛛池模板: 岳普湖县| 册亨县| 五家渠市| 内江市| 突泉县| 宕昌县| 福安市| 子长县| 房山区| 长宁县| 奎屯市| 邳州市| 兴安县| 余姚市| 普兰县| 平潭县| 公安县| 阆中市| 莒南县| 闵行区| 丰台区| 曲阜市| 丹巴县| 新田县| 文水县| 日喀则市| 枣强县| 永仁县| 凯里市| 武鸣县| 大冶市| 图木舒克市| 曲松县| 苍南县| 延川县| 淳化县| 京山县| 绥宁县| 沂源县| 绥中县| 连城县|