Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537
賦值運算符應用錯誤
在 JavaScript 程序中如果你在 if 條件語句中使用賦值運算符的等號 (=) 將會產生一個錯誤結果, 正確的方法是使用比較運算符的兩個等號 (==)。
if 條件語句返回 false (是我們預期的)因為 x 不等于 10:
var x = 0;
if (x == 10)
if 條件語句返回 true (不是我們預期的)因為條件語句執行為 x 賦值 10,10 為 true:
var x = 0;
if (x = 10)
if 條件語句返回 false (不是我們預期的)因為條件語句執行為 x 賦值 0,0 為 false:
var x = 0;
if (x = 0)
賦值語句返回變量的值。 |
比較運算符常見錯誤
在常規的比較中,數據類型是被忽略的,以下 if 條件語句返回 true:
var x = 10;
var y = "10";
if (x == y)
在嚴格的比較運算中,=== 為恒等計算符,同時檢查表達式的值與類型,以下 if 條件語句返回 false:
var x = 10;
var y = "10";
if (x === y)
這種錯誤經常會在 switch 語句中出現,switch 語句會使用恒等計算符(===)進行比較:
以下實例會執行 alert 彈窗:
var x = 10;
switch(x) {
case 10: alert("Hello");
}
以下實例由于類型不一致不會執行 alert 彈窗:
var x = 10;
switch(x) {
case "10": alert("Hello");
}
加法與連接注意事項
加法是兩個數字相加。
連接是兩個字符串連接。
JavaScript 的加法和連接都使用 + 運算符。
接下來我們可以通過實例查看兩個數字相加及數字與字符串連接的區別:
var x = 10 + 5; // x 的結果為 15
var x = 10 + "5"; // x 的結果為 "105"
使用變量相加結果也不一致:
var x = 10;
var y = 5;
var z = x + y; // z 的結果為 15
var x = 10;
var y = "5";
var z = x + y; // z 的結果為 "105"
浮點型數據使用注意事項
JavaScript 中的所有數據都是以 64 位浮點型數據(float) 來存儲。
所有的編程語言,包括 JavaScript,對浮點型數據的精確度都很難確定:
var x = 0.1;
var y = 0.2;
var z = x + y // z 的結果為 0.3
if (z == 0.3) // 返回 false
我解決以上問題,可以用整數的乘除法來解決:
實例
var z = (x * 10 + y * 10) / 10; // z 的結果為 0.3
JavaScript 字符串分行
JavaScript 運行我們在字符串中使用斷行語句:
實例 1
var x =
"Hello World!";
但是,在字符串中直接使用回車換行是會報錯的:
實例 2
var x = "Hello
World!";
我們可以在選擇開發工具或按下 F12 來查看錯誤信息:
字符串斷行需要使用反斜杠(\),如下所示:
實例 3
var x = "Hello \
World!";
錯誤的使用分號
以下實例中,由于分號使用錯誤,if 語句中的代碼塊將無法執行:
if (x == 19);
{
// code block
}
Return 語句使用注意事項
JavaScript 默認是在代碼的最后一行自動結束。
以下兩個實例返回結果是一樣的(一個有分號一個沒有):
實例 1
function myFunction(a) {
var power = 10
return a * power
}
實例 2
function myFunction(a) {
var power = 10;
return a * power;
}
JavaScript 也可以使用多行來結束一個語句。
以下實例返回相同的結果:
實例 3
function myFunction(a) {
var
power = 10;
return a * power;
}
但是,以下實例結果會返回 undefined:
實例 4
function myFunction(a) {
var
power = 10;
return
a * power;
}
為什么會有這樣的結果呢?因為在 JavaScript 中,實例 4 的代碼與下面的代碼一致:
function myFunction(a) {
var
power = 10;
return; // 分號結束,返回 undefined
a * power;}
解析
如果是一個不完整的語句,如下所示:
var
JavaScript 將嘗試讀取第二行的語句:
power = 10;
但是由于這樣的語句是完整的:
return
JavaScript 將自動關閉語句:
return;
在 JavaScript 中,分號是可選的 。
由于 return 是一個完整的語句,所以 JavaScript 將關閉 return 語句。
注意:不用對 return 語句進行斷行。 |
數組中使用名字來索引
許多程序語言都允許使用名字來作為數組的索引。
使用名字來作為索引的數組稱為關聯數組(或哈希)。
JavaScript 不支持使用名字來索引數組,只允許使用數字索引。
實例
var person = [];
person[0] = "John";
person[1] = "Doe";
person[2] = 46;
var x = person.length; // person.length 返回 3
var y = person[0]; // person[0] 返回 "John"
在 JavaScript 中, 對象 使用 名字作為索引。
如果你使用名字作為索引,當訪問數組時,JavaScript 會把數組重新定義為標準對象。
執行這樣操作后,數組的方法及屬性將不能再使用,否則會產生錯誤:
實例
var person = [];
person["firstName"] = "John";
person["lastName"] = "Doe";
person["age"] = 46;
var x = person.length; // person.length 返回 0
var y = person[0]; // person[0] 返回 undefined
定義數組元素,最后不能添加逗號
錯誤的定義方式:
points = [40, 100, 1, 5, 25, 10,];
正確的定義方式:
points = [40, 100, 1, 5, 25, 10];
定義對象,最后不能添加逗號
錯誤的定義方式:
websites = {site:"菜鳥教程", url:"www.runoob.com", like:460,}
正確的定義方式:
websites = {site:"菜鳥教程", url:"www.runoob.com", like:460}
Undefined 不是 Null
在 JavaScript 中, null 用于對象, undefined 用于變量,屬性和方法。
對象只有被定義才有可能為 null,否則為 undefined。
如果我們想測試對象是否存在,在對象還沒定義時將會拋出一個錯誤。
錯誤的使用方式:
if (myObj !== null && typeof myObj !== "undefined")
正確的方式是我們需要先使用 typeof 來檢測對象是否已定義:
if (typeof myObj !== "undefined" && myObj !== null)
程序塊作用域
在每個代碼塊中 JavaScript 不會創建一個新的作用域,一般各個代碼塊的作用域都是全局的。
以下代碼的的變量 i 返回 10,而不是 undefined:
實例
for (var i = 0; i < 10; i++) {
// some code
}
return i;
如您還有不明白的可以在下面與我留言或是與我探討QQ群308855039,我們一起飛!
言
最近與部門老大一起面試了許多前端求職者,其中「想換個學習氛圍較好的人占多數」,但良好的學習氛圍也是需要一點點營造出來的。
為此我們組建了我們團隊內部的“「現代 JavaScript 突擊隊」”,第一期學習內容為《現代 JavaScript 教程》系列,幫助小組成員系統地進行學習鞏固,并「讓大家養成系統性學習和輸出學習總結的學習方式」。
本文作為我輸出的第一部分學習總結,希望作為一份自測清單,幫助大家鞏固知識,溫故知新。
這里也下面分享我們學習小組的“押金制度”和“押金記錄表”
“押金制度”和“押金記錄表”
接下來開始分享自測清單的內容。
初中級前端 JavaScript 自測清單.png
JavaScript 腳本引入方式有兩種:
<script> 標簽有以下常用屬性:
src :指定外部腳本的URI, 如果設置了 src 特性,script 標簽內容將會被忽略;
<script src="example-url.js"></script>
type :指定引用腳本的語言,屬性值為 MIME 類型,包括text/javascript, text/ecmascript, application/javascript, 和application/ecmascript。如果沒有定義這個屬性,腳本會被視作JavaScript。
ES6 新增了屬性值 module ,代碼會被當做 JavaScript 模塊。
<script type="text/javascript"></script>
async 規定一旦腳本可用,則會異步執行。 注意:async 屬性僅適用于外部腳本(「只有在使用 src 屬性時」)。 有多種執行外部腳本的方法: 如果 async="async" :腳本相對于頁面的其余部分異步地執行(當頁面繼續進行解析時,腳本將被執行); 如果不使用 async 且 defer="defer" :腳本將在頁面完成解析時執行; 如果既不使用 async 也不使用 defer :在瀏覽器繼續解析頁面之前,立即讀取并執行腳本;
<script async="async"></script>
defer 屬性規定是否對腳本執行進行延遲,直到頁面加載為止。
如果您的腳本不會改變文檔的內容,可將 defer 屬性加入到 <script> 標簽中,以便加快處理文檔的速度。因為瀏覽器知道它將能夠安全地讀取文檔的剩余部分而不用執行腳本,它將推遲對腳本的解釋,直到文檔已經顯示給用戶為止。
<script defer="defer"></script>
詳細介紹可以閱讀《MDN <script>章節 》。
語句是執行行為(action)的語法結構和命令。如: alert('Hello, world!') 這樣可以用來顯示消息的語句。
存在分行符時,多數情況下可以省略分號。但不全是,比如:
alert(3 +
1
+ 2);
建議新人最好不要省略分號。
「單行注釋以兩個正斜杠字符 // 開始。」
// 注釋文本
console.log("leo");
「多行注釋以一個正斜杠和星號開始 “/*” 并以一個星號和正斜桿結束 “*/”。」
/*
這是多行注釋。
第二行注釋。
*/
console.log("leo");
JavaScript 的嚴格模式是使用受限制的 JavaScript 的一種方式,從而隱式地退出“草率模式”。
"use strict" 指令將瀏覽器引擎轉換為“現代”模式,改變一些內建特性的行為。
通過在腳本文件/函數開頭添加 "use strict"; 聲明,即可啟用嚴格模式。 全局開啟嚴格模式:
// index.js
"use strict";
const v = "Hi! I'm a strict mode script!";
函數內開啟嚴格模式:
// index.js
function strict() {
'use strict';
function nested() {
return "And so am I!";
}
return "Hi! I'm a strict mode function! " + nested();
}
啟用 "use strict" 后,為未定義元素賦值將拋出異常:
"use strict";
leo = 17; // Uncaught ReferenceError: leo is not defined
啟用 "use strict" 后,試圖刪除不可刪除的屬性時會拋出異常:
"use strict";
delete Object.prototype; // Uncaught TypeError: Cannot delete property 'prototype' of function Object() { [native code] }
詳細介紹可以閱讀《MDN 嚴格模式章節 》。
變量是數據的“命名存儲”。
目前定義變量可以使用三種關鍵字:var / let / const。三者區別可以閱讀《let 和 const 命令》 。
let name = "leo";
let name = "leo", age, addr;
let name = "leo", age = 27, addr = "fujian";
變量命名有 2 個限制:
JavaScript 是一種「弱類型」或者說「動態語言」。這意味著你不用提前聲明變量的類型,在程序運行過程中,類型會被自動確定。這也意味著你可以使用同一個變量保存不同類型的數據:
var foo = 42; // foo is a Number now
foo = "bar"; // foo is a String now
foo = true; // foo is a Boolean now
詳細介紹可以閱讀《MDN JavaScript 數據類型和數據結構 》。
前七種為基本數據類型,也稱為原始類型(值本身無法被改變),而 object 為復雜數據類型。 八大數據類型分別是:
通過 typeof 運算符檢查:
typeof "leo" // "string"
typeof undefined // "undefined"
typeof 0 // "number"
typeof NaN // "number"
typeof 10n // "bigint"
typeof true // "boolean"
typeof Symbol("id") // "symbol"
typeof [1,2,3,4] // "object"
typeof Math // "object" (1) Math 是一個提供數學運算的內建 object。
typeof null // "object" (2) JavaScript 語言的一個錯誤,null 不是一個 object。null 有自己的類型,它是一個特殊值。
typeof alert // "function" (3) alert 在 JavaScript 語言中是一個函數。
JavaScript 變量可以轉換為新變量或其他數據類型:
通過全局方法 String() 將**其他類型數據(任何類型的數字,字母,布爾值,對象)**轉換為 String 類型:
String(123); // "123"
// Number方法toString()/toExponential()/toFixed()/toPrecision() 也有同樣效果。
String(false); // "false"
// Boolean方法 toString() 也有同樣效果。
String(new Date()); // "Sun Jun 07 2020 21:44:20 GMT+0800 (中國標準時間)"
// Date方法 toString() 也有同樣效果。
String(leo);
通過以下幾種方式能將其他類型數據轉換為 Number 類型:
const age = +"22"; // 22
const age = Number("22"); // 22
Number.parseFloat("22"); // 22
Number.parseInt("22"); // 22
// 布爾值
Number(false) // 返回 0
Number(true) // 返回 1
// 日期
const date = new Date();
Number(date); // 返回 1591537858154
date.getTime(); // 返回 1591537858154,效果一致。
// 自動轉換
5 + null // 返回 5 null 轉換為 0
"5" + null // 返回"5null" null 轉換為 "null"
"5" + 1 // 返回 "51" 1 轉換為 "1"
"5" - 1 // 返回 4 "5" 轉換為 5
轉換規則如下:
Boolean(1); // true
Boolean(0); // false
Boolean("hello"); // true
Boolean(""); // false
Boolean("0"); // true
Boolean(" "); // 空白, 也是 true (任何非空字符串是 true)
類型轉換
常見運算符如加法 + 、減法 - 、乘法 * 和除法 / ,舉一個例子,來介紹一些概念:
let sum = 1 + 2;
let age = +18;
其中:
let msg = "hello " + "leo"; // "hello leo"
let total = 10 + 20; // 30
let text1 = "1" + "2"; // "12"
let text2 = "1" + 2; // "12"
let text3 = 1 + "2"; // "12"
let text4 = 1 + 2 + "3"; // "33"
let num = +text1; // 12 轉換為 Number 類型
運算符的優先級決定了表達式中運算執行的先后順序,優先級高的運算符最先被執行。 下面的表將所有運算符按照優先級的不同從高(20)到低(1)排列。
優先級 運算類型 關聯性 運算符 20 圓括號 n/a(不相關) ( … ) 19 成員訪問 從左到右 … . … 需計算的成員訪問 從左到右 … [ … ] new (帶參數列表) n/a new … ( … ) 函數調用 從左到右 … ( … ) 可選鏈(Optional chaining) 從左到右 ?. 18 new (無參數列表) 從右到左 new … 17 后置遞增(運算符在后) n/a … ++ 后置遞減(運算符在后) … -- 16 邏輯非 從右到左 ! … 按位非 ~ … 一元加法 + … 一元減法 - … 前置遞增 ++ … 前置遞減 -- … typeof typeof … void void … delete delete … await await … 15 冪 從右到左 … ** … 14 乘法 從左到右 … * … 除法 … / … 取模 … % … 13 加法 從左到右 … + … 減法 … - … 12 按位左移 從左到右 … << … 按位右移 … >> … 無符號右移 … >>> … 11 小于 從左到右 … < … 小于等于 … <= … 大于 … > … 大于等于 … >= … in … in … instanceof … instanceof … 10 等號 從左到右 … == … 非等號 … != … 全等號 … === … 非全等號 … !== … 9 按位與 從左到右 … & … 8 按位異或 從左到右 … ^ … 7 按位或 從左到右 … | … 6 邏輯與 從左到右 … && … 5 邏輯或 從左到右 … || … 4 條件運算符 從右到左 … ? … : … 3 賦值 從右到左 … = … … += … … -= … … *= … … /= … … %= … … <<= … … >>= … … >>>= … … &= … … ^= … … |= … 2 yield 從右到左 yield … yield* yield* … 1 展開運算符 n/a ... … 0 逗號 從左到右 … , …
3 > 2 && 2 > 1
// return true
3 > 2 > 1
// 返回 false,因為 3 > 2 是 true,并且 true > 1 is false
// 加括號可以更清楚:(3 > 2) > 1
在 JS 中的值的比較與數學很類型:
// 使用 ==,非嚴格等于,不關心值類型
// == 運算符會對比較的操作數做隱式類型轉換,再比較
'1' == 1; // true
// 使用 ===,嚴格相等,關心值類型
// 將數字值 -0 和 +0 視為相等,并認為 Number.NaN 不等于 NaN。
'1' === 1; // false
(圖片來自:《MDN JavaScript 中的相等性判斷》)
另外 ES6 新增 Object.is 方法判斷兩個值是否相同,語法如下:
Object.is(value1, value2);
以下任意項成立則兩個值相同:
Object.is('foo', 'foo'); // true
Object.is(window, window); // true
Object.is('foo', 'bar'); // false
Object.is([], []); // false
var foo = { a: 1 };
var bar = { a: 1 };
Object.is(foo, foo); // true
Object.is(foo, bar); // false
Object.is(null, null); // true
// 特例
Object.is(0, -0); // false
Object.is(0, +0); // true
Object.is(-0, -0); // true
Object.is(NaN, 0/0); // true
兼容性 Polyfill 處理:
if (!Object.is) {
Object.is = function(x, y) {
// SameValue algorithm
if (x === y) { // Steps 1-5, 7-10
// Steps 6.b-6.e: +0 != -0
return x !== 0 || 1 / x === 1 / y;
} else {
// Step 6.a: NaN == NaN
return x !== x && y !== y;
}
};
}
對于相等性判斷比較簡單:
null == undefined; // true
null === undefined; // false
對于其他比較,它們會先轉換位數字: null 轉換為 0 , undefied 轉換為 NaN 。
null > 0; // false 1
null >= 0; // true 2
null == 0; // false 3
null < 1; // true 4
需要注意: null == 0; // false 這里是因為:undefined 和 null 在相等性檢查 == 中「不會進行任何的類型轉換」,它們有自己獨立的比較規則,所以除了它們之間互等外,不會等于任何其他的值。
undefined > 0; // false 1
undefined > 1; // false 2
undefined == 0; // false 3
第 1、2 行都返回 false 是因為 undefined 在比較中被轉換為了 NaN,而 NaN 是一個特殊的數值型值,它與任何值進行比較都會返回 false。 第 3 行返回 false 是因為這是一個相等性檢查,而 undefined 只與 null 相等,不會與其他值相等。
顯示一個警告對話框,上面顯示有指定的文本內容以及一個“確定”按鈕。 「注意:彈出模態框,并暫停腳本,直到用戶點擊“確定”按鈕。」
// 語法
window.alert(message);
alert(message);
// 示例
alert('hello leo!');
message是要顯示在對話框中的文本字符串,如果傳入其他類型的值,會轉換成字符串。
顯示一個對話框,對話框中包含一條文字信息,用來提示用戶輸入文字。 「注意:彈出模態框,并暫停腳本,直到用戶點擊“確定”按鈕。」 當點擊確定返回文本,點擊取消或按下 Esc 鍵返回 null。 語法如下:
let result = window.prompt(text, value);
Window.confirm() 方法顯示一個具有一個可選消息和兩個按鈕(確定和取消)的模態對話框。 「注意:彈出模態框,并暫停腳本,直到用戶點擊“確定”按鈕。」 語法如下:
let result = window.confirm(message);
當 if 語句當條件表達式,會將表達式轉換為布爾值,當為 truthy 時執行里面代碼。 轉換規則如:
「條件(三元)運算符」是 JavaScript 僅有的使用三個操作數的運算符。一個條件后面會跟一個問號(?),如果條件為 truthy ,則問號后面的表達式A將會執行;表達式A后面跟著一個冒號(:),如果條件為 falsy ,則冒號后面的表達式B將會執行。本運算符經常作為 [if](https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Statements/if...else) 語句的簡捷形式來使用。 語法:
condition ? exprIfTrue : exprIfFalse
let getUser = function(name){
return name === 'leo' ? 'hello leo!' : 'unknow user';
}
// 可以簡寫如下:
let getUser = name => name === 'leo' ? 'hello leo!' : 'unknow user';
getUser('leo'); // "hello leo!"
getUser('pingan'); // "unknow user"
詳細可以閱讀《MDN 邏輯運算符》 。
邏輯運算符如下表所示 (其中_expr_可能是任何一種類型, 不一定是布爾值):
運算符 語法 說明 邏輯與,AND(&&) _expr1_ && _expr2_ 若 expr**1** 可轉換為 true,則返回 expr**2**;否則,返回 expr**1**。 邏輯或,OR(||) _expr1_ || _expr2_ 若 expr**1** 可轉換為 true,則返回 expr**1**;否則,返回 expr**2**。 邏輯非,NOT(!) !_expr_ 若 expr 可轉換為 true,則返回 false;否則,返回 true。
如果一個值可以被轉換為 true,那么這個值就是所謂的 truthy,如果可以被轉換為 false,那么這個值就是所謂的 falsy。 會被轉換為 false 的表達式有:
a1 = true && true // t && t 返回 true
a2 = true && false // t && f 返回 false
a3 = false && true // f && t 返回 false
a4 = false && (3 == 4) // f && f 返回 false
a5 = "Cat" && "Dog" // t && t 返回 "Dog"
a6 = false && "Cat" // f && t 返回 false
a7 = "Cat" && false // t && f 返回 false
a8 = '' && false // f && f 返回 ""
a9 = false && '' // f && f 返回 false
o1 = true || true // t || t 返回 true
o2 = false || true // f || t 返回 true
o3 = true || false // t || f 返回 true
o4 = false || (3 == 4) // f || f 返回 false
o5 = "Cat" || "Dog" // t || t 返回 "Cat"
o6 = false || "Cat" // f || t 返回 "Cat"
o7 = "Cat" || false // t || f 返回 "Cat"
o8 = '' || false // f || f 返回 false
o9 = false || '' // f || f 返回 ""
n1 = !true // !t 返回 false
n2 = !false // !f 返回 true
n3 = !'' // !f 返回 true
n4 = !'Cat' // !t 返回 false
n1 = !!true // !!truthy 返回 true
n2 = !!{} // !!truthy 返回 true: 任何 對象都是 truthy 的…
n3 = !!(new Boolean(false)) // …甚至 .valueOf() 返回 false 的布爾值對象也是!
n4 = !!false // !!falsy 返回 false
n5 = !!"" // !!falsy 返回 false
n6 = !!Boolean(false) // !!falsy 返回 false
condi1 && confi2
// 轉換為
!(!condi1 || !condi2)
condi1 || condi2
// 轉換為
!(!condi1 && !condi2)
由于邏輯表達式的運算順序是從左到右,也可以用以下規則進行"短路"計算:
function A(){ console.log('called A'); return false; }
function B(){ console.log('called B'); return true; }
console.log( A() && B() );
// logs "called A" due to the function call,
// then logs false (which is the resulting value of the operator)
console.log( B() || A() );
// logs "called B" due to the function call,
// then logs true (which is the resulting value of the operator)
與運算 && 的優先級比或運算 || 要高。 所以代碼 a && b || c && d 完全跟 && 表達式加了括號一樣:(a && b) || (c && d)。
詳細可以閱讀《MDN while》 。 「while 語句」可以在某個條件表達式為真的前提下,循環執行指定的一段代碼,直到那個表達式不為真時結束循環。 如:
var n = 0;
var x = 0;
while (n < 3) {
n++;
x += n;
}
當循環體為單行時,可以不寫大括號:
let i = 3;
while(i) console.log(i --);
詳細可以閱讀《MDN do...while》 。 do...while 語句創建一個執行指定語句的循環,直到condition值為 false。在執行statement 后檢測condition,所以指定的statement至少執行一次。 如:
var result = '';
var i = 0;
do {
i += 1;
result += i + ' ';
} while (i < 5);
詳細可以閱讀《MDN for》 。 for 語句用于創建一個循環,它包含了三個可選的表達式,這三個表達式被包圍在圓括號之中,使用分號分隔,后跟一個用于在循環中執行的語句(通常是一個塊語句)。 語法如:
for (begin; condition; step) {
// ……循環體……
}
示例:
for (let i = 0; i < 3; i++) {
console.log(i);
}
描述:
begin i = 0 進入循環時執行一次。 condition i < 3 在每次循環迭代之前檢查,如果為 false,停止循環。 body(循環體) alert(i) 條件為真時,重復運行。 step i++ 在每次循環體迭代后執行。
for 語句頭部圓括號中的所有三個表達式都是可選的。
var i = 0;
for (; i < 3; i++) {
console.log(i);
}
for (var i = 0;; i++) {
console.log(i);
if (i > 3) break;
}
var i = 0;
for (;;) {
if (i > 3) break;
console.log(i);
i++;
}
詳細可以閱讀《MDN break》 。 break 語句中止當前循環,switch語句或label 語句,并把程序控制流轉到緊接著被中止語句后面的語句。 在 while 語句中:
function testBreak(x) {
var i = 0;
while (i < 6) {
if (i == 3) {
break;
}
i += 1;
}
return i * x;
}
另外,也可以為代碼塊做標記,并在 break 中指定要跳過的代碼塊語句的 label:
outer_block:{
inner_block:{
console.log ('1');
break outer_block; // breaks out of both inner_block and outer_block
console.log (':-('); // skipped
}
console.log ('2'); // skipped
}
需要注意的是:break 語句需要內嵌在它所應用的標簽或代碼塊中,否則報錯:
block_1:{
console.log ('1');
break block_2; // SyntaxError: label not found
}
block_2:{
console.log ('2');
}
continue 聲明終止當前循環或標記循環的當前迭代中的語句執行,并在下一次迭代時繼續執行循環。 與 break 語句的區別在于, continue 并不會終止循環的迭代,而是:
i = 0;
n = 0;
while (i < 5) {
i++;
if (i === 3) {
continue;
}
n += i;
}
帶 label:
var i = 0,
j = 8;
checkiandj: while (i < 4) {
console.log("i: " + i);
i += 1;
checkj: while (j > 4) {
console.log("j: "+ j);
j -= 1;
if ((j % 2) == 0)
continue checkj;
console.log(j + " is odd.");
}
console.log("i = " + i);
console.log("j = " + j);
}
「禁止 「break/continue」 在 ‘?’ 的右邊:」
(i > 5) ? console.log(i) : continue; // continue 不允許在這個位置
這樣會提示語法錯誤。 請注意非表達式的語法結構不能與三元運算符 ? 一起使用。特別是 break/continue 這樣的指令是不允許這樣使用的。
三種循環:
switch 語句用來將表達式的值與 case 語句匹配,并執行與情況對應的語句。 switch 語句可以替代多個 if 判斷,為多個分支選擇的情況提供一個更具描述性的方式。
switch 語句至少包含一個 case 代碼塊和一個可選的 default 代碼塊:
switch(expression) {
case 'value1':
// do something ...
[break]
default:
// ...
[break]
}
當 expression 表達式的值與 value1 匹配時,則執行其中代碼塊。 如果沒有 case 子句匹配,則會選擇 default 子句執行,若連 default 子句都沒有,則直接執行到 switch 結束。
所謂 case 分組,就是與多個 case 分支共享同一段代碼,如下面例子中 case 1 和 case 2:
let a = 2;
switch (a) {
case 1: // (*) 下面這兩個 case 被分在一組
case 2:
console.log('case is 1 or 2!');
break;
case 3:
console.log('case is 3!');
break;
default:
console.log('The result is default.');
}
// 'case is 1 or 2!'
function f(n){
let a ;
switch(n){
case 1:
a = 'number';
break;
case '1':
a = 'string';
break;
default:
a = 'default';
break;
}
console.log(a)
}
f(1); // number
f('1'); // string
let a = 2 + 2;
switch (a) {
case 3:
console.log( 'Too small' );
case 4:
console.log( 'Exactly!' );
case 5:
console.log( 'Too big' );
default:
console.log( "I don't know such values" );
}
// Exactly!
// Too big
// I don't know such values
function f(n){
switch (n) {
case 2:
console.log(2);
break;
default:
console.log('default')
break;
case 1:
console.log('1');
break;
}
}
f(1); // 1
f(2); // 2
f(3); // default
// 以下定義會報錯
function f(n){
switch(n){
case 1:
let msg = 'hello';
console.log(1);
break;
case 2:
let msg = 'leo';
break;
default:
console.log('default');
break;
}
}
// Error: Uncaught SyntaxError: Identifier 'msg' has already been declared
這是由于兩個 let 處于同一個塊級作用域,所以它們被認為是同一變量名的重復聲明。 解決方式,只需要將 case 語句包裝在括號內即可解決:
function f(n){
switch(n){
case 1:{ // added brackets
let msg = 'hello';
console.log(msg);
break;
}
case 2: {
let msg = 'leo';
console.log(msg);
break;
}
default:
console.log('default');
break;
}
}
函數可以讓一段代碼被多次調用,避免重復代碼。 如之前學習到的一些內置函數: alert(msg) / prompt(msg, default) / confirm(quesyion) 等。
定義函數有兩種方式:「函數聲明」和「函數表達式」。
如定義一個簡單 getUser 函數:
function getUser(name){
return 'hello ' + name;
}
getUser('leo"); // 函數調用
通過函數聲明來定義函數時,需要由以下幾部分組成:
類似聲明變量,還是以 getUser 為例:
let getUser = function(name){
return 'hello ' + name;
}
另外,函數表達式也可以提供函數名,并用于函數內部指代函數本身:
let fun = function f(n){
return n < 3 ? 1 : n * f(n - 1);
}
fun(3); // 3
fun(5); // 60
當定義一個函數后,它并不會自動執行,而是需要使用函數名稱進行調用,如上面例子:
fun(3); // 3
「只要注意:」 使用 「函數表達式」 定義函數時,調用函數的方法必須寫在定義之后,否則報錯:
console.log(fun()); // Uncaught ReferenceError: fun is not defined
let fun = function(){return 1};
而使用 「函數聲明」 則不會出現該問題:
console.log(fun()); // 1
function fun(){return 1};
原因就是:函數提升僅適用于函數聲明,而不適用于函數表達式。
在函數中,可以使用局部變量和外部變量。
函數中聲明的變量只能在該函數內可見。
let fun = function(){
let name = 'leo';
}
fun();
console.log(name); // Uncaught ReferenceError: name is not defined
函數內可以使用外部變量,并且可以修改外部變量的值。
let name = 'leo';
let fun = function(){
let text = 'Hello, ' + name;
console.log(text);
}
fun(); // Hello, leo
當函數內也有與外部變量名稱相同的變量,會忽略外部變量:
let name = 'leo';
let fun = function(){
let name = 'pingan8787';
let text = 'Hello, ' + name;
console.log(text);
}
fun(); // Hello, pingan8787
從ECMAScript 6開始,有兩個新的類型的參數:默認參數,剩余參數。
若函數沒有傳入參數,則參數默認值為undefined,通常設置參數默認值是這樣做的:
// ES6 之前,沒有設置默認值
function f(a, b){
b = b ? b : 1;
return a * b;
}
f(2,3); // 6
f(2); // 2
// ES6,設置默認值
function f(a, b = 1){
return a * b;
}
f(2,3); // 6
f(2); // 2
可以將參數中不確定數量的參數表示成數組,如下:
function f (a, ...b){
console.log(a, b);
}
f(1,2,3,4); // a => 1 b => [2, 3, 4]
既然講到參數,那就不能少了 arguments 對象。
函數的實際參數會被保存在一個「類似數組的arguments對象」中。在函數內,我們可以使用 arguments 對象獲取函數的所有參數:
let fun = function(){
console.log(arguments);
console.log(arguments.length);
}
fun('leo');
// Arguments ["leo", callee: ?, Symbol(Symbol.iterator): ?]
// 1
以一個實際示例介紹,實現將任意數量參數連接成一個字符串,并輸出的函數:
let argumentConcat = function(separator){
let result = '', i;
for(i = 1; i < arguments.length; i ++){
result += arguments[i] + separator;
}
return result;
}
argumentConcat(',', 'leo', 'pingan'); //"leo,pingan,"
在函數任意位置,指定 return 指令來停止函數的執行,并返回函數指定的返回值。
let sum = function(a, b){
return a + b;
};
let res = sum(1, 2);
console.log(res); // 3
默認空值的 return 或沒有 return 的函數返回值為 undefined 。
函數表達式是一種函數定義方式,在前面章節中已經介紹到了,這個部分將著重介紹 「函數表達式」 和 「函數聲明」 的區別:
// 函數表達式
let fun = function(){};
// 函數聲明
function fun(){}
函數表達式會在代碼執行到達時被創建,并且僅從那一刻可用。 而函數聲明被定義之前,它就可以被調用。
// 函數表達式
fun(); // Uncaught ReferenceError: fun is not defined
let fun = function(){console.log('leo')};
// 函數聲明
fun(); // "leo"
function fun(){console.log('leo')};
建議優先考慮函數聲明語法,它能夠為組織代碼提供更多靈活性,因為我們可以在聲明函數前調用該函數。
「本章節簡單介紹箭頭函數基礎知識,后面章節會完整介紹。」 「函數箭頭表達式」是ES6新增的函數表達式的語法,也叫「胖箭頭函數」,變化:更簡潔的函數和this。
// 有1個參數
let f = v => v;
// 等同于
let f = function (v){return v};
// 有多個參數
let f = (v, i) => {return v + i};
// 等同于
let f = function (v, i){return v + i};
// 沒參數
let f = () => 1;
// 等同于
let f = function (){return 1};
let arr = [1,2,3,4];
arr.map(ele => ele + 1); // [2, 3, 4, 5]
function Person(){
this.age = 0;
setInterval(() => {
this.age++;
}, 1000);
}
var p = new Person(); // 定時器一直在執行 p的值一直變化
本文作為《初中級前端 JavaScript 自測清單》第一部分,介紹的內容以常用基礎知識為主,并在學習資料中,將知識點結合實際開發中遇到的場景進行展開介紹。希望能幫助大家自測自己的 JavaScript 水平并查缺補漏,溫故知新。
Author 王平安 E-mail pingan8787@qq.com 博 客 www.pingan8787.com 微 信 pingan8787 每日文章推薦 https://github.com/pingan8787/Leo_Reading/issues ES小冊 js.pingan8787.com 語雀知識庫 Cute-FrontEnd
bg
著大數據時代的發展,各個公司的數據保護意識越來越強,大家都在想盡辦法保護自家產品的數據不輕易被爬蟲爬走。由于網頁是提供信息和服務的重要載體,所以對網頁上的信息進行保護就成了至關重要的一個環節。
網頁是運行在瀏覽器端的,當我們瀏覽一個網頁時,其 HTML 代碼、 JavaScript 代碼都會被下載到瀏覽器中執行。借助瀏覽器的開發者工具,我們可以看到網頁在加載過程中所有網絡請求的詳細信息,也能清楚地看到網站運行的 HTML 代碼和 JavaScript 代碼,這些代碼中就包含了網站加載的全部邏輯,如加載哪些資源、請求接口是如何構造的、頁面是如何渲染的等等。正因為代碼是完全透明的,所以如果我們能夠把其中的執行邏輯研究出來,就可以模擬各個網絡請求進行數據爬取了。
然而,事情沒有想象得那么簡單。隨著前端技術的發展,前端代碼的打包技術、混淆技術、加密技術也層出不窮,借助于這些技術,各個公司可以在前端對 JavaScript 代碼采取一定的保護,比如變量名混淆、執行邏輯混淆、反調試、核心邏輯加密等,這些保護手段使得我們沒法很輕易地找出 JavaScript 代碼中包含的的執行邏輯。
在前幾章的案例中,我們也試著爬取了各種形式的網站。其中有的網站的數據接口是沒有任何驗證或加密參數的,我們可以輕松模擬并爬取其中的數據;但有的網站稍顯復雜,網站的接口中增加了一些加密參數,同時對 JavaScript 代碼采取了上文所述的一些防護措施,當時我們沒有直接嘗試去破解,而是用 Selenium 等類似工具來實現模擬瀏覽器執行的方式來進行“所見即所得“的爬取。其實對于后者,我們還有另外一種解決方案,那就是直接逆向 JavaScript 代碼,找出其中的加密邏輯,從而直接實現該加密邏輯來進行爬取。如果加密邏輯實在過于復雜,我們也可以找出一些關鍵入口,從而實現對加密邏輯的單獨模擬執行和數據爬取。這些方案難度可能很大,比如關鍵入口很難尋找,或者加密邏輯難以模擬,可是一旦成功找到突破口,我們便可以不用借助于 Selenium 等工具進行整頁數據的渲染而實現數據爬取,這樣爬取效率會大幅提升。
本章我們首先會對 JavaScript 防護技術進行介紹,然后介紹一些常用的 JavaScript 逆向技巧,包括瀏覽器工具的使用、Hook 技術、AST 技術、特殊混淆技術的處理、WebAssembly 技術的處理。了解了這些技術,我們可以更從容地應對 JavaScript 防護技術。
我們在爬取網站的時候,會遇到一些情況需要分析一些接口或 URL 信息,在這個過程中,我們會遇到各種各樣類似加密的情形,比如說:
這些情況呢,基本上都是網站為了保護其本身的一些數據不被輕易抓取而采取的一些措施,我們可以把它歸類為兩大類:
這一節我們就來了解下這兩類技術的基本原理和一些常見的示例。知己知彼,百戰不殆,了解了這些技術的實現原理之后,我們才能更好地去逆向其中的邏輯,從而實現數據爬取。
當今大數據時代,數據已經變得越來越重要,網頁和 App 現在是主流的數據載體,如果其數據的 API 沒有設置任何保護措施,在爬蟲工程師解決了一些基本的反爬如封 IP、驗證碼的問題之后,那么數據還是可以被輕松爬取到的。
那么,有沒有可能在 URL/API 層面或 JavaScript 層面也加上一層防護呢?答案是可以。
網站運營者首先想到防護措施可能是對某些數據接口的參數進行加密,比如說對某些 URL 的一些參數加上校驗碼或者把一些 id 信息進行編碼,使其變得難以閱讀或構造;或者對某些 API 請求加上一些 token、sign 等簽名,這樣這些請求發送到服務器時,服務器會通過客戶端發來的一些請求信息以及雙方約定好的秘鑰等來對當前的請求進行校驗,如果校驗通過,才返回對應數據結果。
比如說客戶端和服務端約定一種接口校驗邏輯,客戶端在每次請求服務端接口的時候都會附帶一個 sign 參數,這個 sign 參數可能是由當前時間信息、請求的 URL、請求的數據、設備的 ID、雙方約定好的秘鑰經過一些加密算法構造而成的,客戶端會實現這個加密算法構造 sign,然后每次請求服務器的時候附帶上這個參數。服務端會根據約定好的算法和請求的數據對 sign 進行校驗,如果校驗通過,才返回對應的數據,否則拒絕響應。
當然登錄狀態的校驗也可以看作是此類方案,比如一個 API 的調用必須要傳一個 token,這個 token 必須用戶登錄之后才能獲取,如果請求的時候不帶該 token,API 就不會返回任何數據。
倘若沒有這種措施,那么基本上 URL 或者 API 接口是完全公開可以訪問的,這意味著任何人都可以直接調用來獲取數據,幾乎是零防護的狀態,這樣是非常危險的,而且數據也可以被輕易地被爬蟲爬取。因此對 URL/API 參數一些加密和校驗是非常有必要的。
接口加密技術看起來的確是一個不錯的解決方案,但單純依靠它并不能很好地解決問題。為什么呢?
對于網頁來說,其邏輯是依賴于 JavaScript 來實現的,JavaScript 有如下特點:
由于這兩個原因,至使 JavaScript 代碼是不安全的,任何人都可以讀、分析、復制、盜用,甚至篡改。
所以說,對于上述情形,客戶端 JavaScript 對于某些加密的實現是很容易被找到或模擬的,了解了加密邏輯后,模擬參數的構造和請求也就是輕而易舉了,所以如果 JavaScript 沒有做任何層面的保護的話,接口加密技術基本上對數據起不到什么防護作用。
如果你不想讓自己的數據被輕易獲取,不想他人了解 JavaScript 邏輯的實現,或者想降低被不懷好意的人甚至是黑客攻擊。那么就需要用到 JavaScript 壓縮、混淆和加密技術了。
這里壓縮、混淆和加密技術簡述如下:
下面我們對上面的技術分別予以介紹。
現在絕大多數網站的數據一般都是通過服務器提供的 API 來獲取的,網站或 App 可以請求某個數據 API 獲取到對應的數據,然后再把獲取的數據展示出來。但有些數據是比較寶貴或私密的,這些數據肯定是需要一定層面上的保護。所以不同 API 的實現也就對應著不同的安全防護級別,我們這里來總結下。
為了提升接口的安全性,客戶端會和服務端約定一種接口校驗方式,一般來說會使用到各種加密和編碼算法,如 Base64、Hex 編碼,MD5、AES、DES、RSA 等對稱或非對稱加密。
舉個例子,比如說客戶端和服務器雙方約定一個 sign 用作接口的簽名校驗,其生成邏輯是客戶端將 URL Path 進行 MD5 加密然后拼接上 URL 的某個參數再進行 Base64 編碼,最后得到一個字符串 sign,這個 sign 會通過 Request URL 的某個參數或 Request Headers 發送給服務器。服務器接收到請求后,對 URL Path 同樣進行 MD5 加密,然后拼接上 URL 的某個參數,也進行 Base64 編碼也得到了一個 sign,然后比對生成的 sign 和客戶端發來的 sign 是否是一致的,如果是一致的,那就返回正確的結果,否則拒絕響應。這就是一個比較簡單的接口參數加密的實現。如果有人想要調用這個接口的話,必須要定義好 sign 的生成邏輯,否則是無法正常調用接口的。
當然上面的這個實現思路比較簡單,這里還可以增加一些時間戳信息增加時效性判斷,或增加一些非對稱加密進一步提高加密的復雜程度。但不管怎樣,只要客戶端和服務器約定好了加密和校驗邏輯,任何形式加密算法都是可以的。
這里要實現接口參數加密就需要用到一些加密算法,客戶端和服務器肯定也都有對應的 SDK 實現這些加密算法,如 JavaScript 的 crypto-js,Python 的 hashlib、Crypto 等等。
但還是如上文所說,如果是網頁的話,客戶端實現加密邏輯如果是用 JavaScript 來實現,其源代碼對用戶是完全可見的,如果沒有對 JavaScript 做任何保護的話,是很容易弄清楚客戶端加密的流程的。
因此,我們需要對 JavaScript 利用壓縮、混淆等方式來對客戶端的邏輯進行一定程度上的保護。
這個非常簡單,JavaScript 壓縮即去除 JavaScript 代碼中的不必要的空格、換行等內容或者把一些可能公用的代碼進行處理實現共享,最后輸出的結果都壓縮為幾行內容,代碼可讀性變得很差,同時也能提高網站加載速度。
如果僅僅是去除空格換行這樣的壓縮方式,其實幾乎是沒有任何防護作用的,因為這種壓縮方式僅僅是降低了代碼的直接可讀性。如果我們有一些格式化工具可以輕松將 JavaScript 代碼變得易讀,比如利用 IDE、在線工具或 Chrome 瀏覽器都能還原格式化的代碼。
比如這里舉一個最簡單的 JavaScript 壓縮示例,原來的 JavaScript 代碼是這樣的:
function echo(stringA, stringB) {
const name = "Germey";
alert("hello " + name);
}
壓縮之后就變成這樣子:
function echo(d, c) {
const e = "Germey";
alert("hello " + e);
}
可以看到這里參數的名稱都被簡化了,代碼中的空格也被去掉了,整個代碼也被壓縮成了一行,代碼的整體可讀性降低了。
目前主流的前端開發技術大多都會利用 Webpack、Rollup 等工具進行打包,Webpack、Rollup 會對源代碼進行編譯和壓縮,輸出幾個打包好的 JavaScript 文件,其中我們可以看到輸出的 JavaScript 文件名帶有一些不規則字符串,同時文件內容可能只有幾行內容,變量名都是一些簡單字母表示。這其中就包含 JavaScript 壓縮技術,比如一些公共的庫輸出成 bundle 文件,一些調用邏輯壓縮和轉義成冗長的幾行代碼,這些都屬于 JavaScript 壓縮。另外其中也包含了一些很基礎的 JavaScript 混淆技術,比如把變量名、方法名替換成一些簡單字符,降低代碼可讀性。
但整體來說,JavaScript 壓縮技術只能在很小的程度上起到防護作用,要想真正提高防護效果還得依靠 JavaScript 混淆和加密技術。
JavaScript 混淆是完全是在 JavaScript 上面進行的處理,它的目的就是使得 JavaScript 變得難以閱讀和分析,大大降低代碼可讀性,是一種很實用的 JavaScript 保護方案。
JavaScript 混淆技術主要有以下幾種:
總之,以上方案都是 JavaScript 混淆的實現方式,可以在不同程度上保護 JavaScript 代碼。
在前端開發中,現在 JavaScript 混淆主流的實現是 javascript-obfuscator (https://github.com/javascript-obfuscator/javascript-obfuscator) 和 terser (https://github.com/terser/terser) 這兩個庫,其都能提供一些代碼混淆功能,也都有對應的 Webpack 和 Rollup 打包工具的插件,利用它們我們可以非常方便地實現頁面的混淆,最終可以輸出壓縮和混淆后的 JavaScript 代碼,使得 JavaScript 代碼可讀性大大降低。
下面我們以 javascript-obfuscator 為例來介紹一些代碼混淆的實現,了解了實現,那么自然我們就對混淆的機理有了更加深刻的認識。
javascript-obfuscator 的官網地址為:https://obfuscator.io/,其官方介紹內容如下:
A free and efficient obfuscator for JavaScript (including ES2017). Make your code harder to copy and prevent people from stealing your work.
它是支持 ES8 的免費、高效的 JavaScript 混淆庫,它可以使得你的 JavaScript 代碼經過混淆后難以被復制、盜用,混淆后的代碼具有和原來的代碼一模一樣的功能。
怎么使用呢?首先,我們需要安裝好 Node.js 12.x 版本及以上,確保可以正常使用 npm 命令,具體的安裝方式可以參考:https://setup.scrape.center/nodejs。
接著新建一個文件夾,比如 js-obfuscate,然后進入該文件夾,初始化工作空間:
npm init
這里會提示我們輸入一些信息,創建一個 package.json 文件,這就完成了項目初始化了。
接下來我們來安裝 javascript-obfuscator 這個庫:
npm i -D javascript-obfuscator
稍等片刻,即可看到本地 js-obfuscate 文件夾下生成了一個 node_modules 文件夾,里面就包含了 javascript-obfuscator 這個庫,這就說明安裝成功了,文件夾結構如圖所示:
接下來我們就可以編寫代碼來實現一個混淆樣例了,如新建一個 main.js 文件,內容如下:
const code = `
let x = '1' + 1
console.log('x', x)
`;
const options = {
compact: false,
controlFlowFlattening: true,
};
const obfuscator = require("javascript-obfuscator");
function obfuscate(code, options) {
return obfuscator.obfuscate(code, options).getObfuscatedCode();
}
console.log(obfuscate(code, options));
在這里我們定義了兩個變量,一個是 code,即需要被混淆的代碼,另一個是混淆選項,是一個 Object。接下來我們引入了 javascript-obfuscator 這庫,然后定義了一個方法,傳入 code 和 options,來獲取混淆后的代碼,最后控制臺輸出混淆后的代碼。
代碼邏輯比較簡單,我們來執行一下代碼:
node main.js
輸出結果如下:
var _0x53bf = ["log"];
(function (_0x1d84fe, _0x3aeda0) {
var _0x10a5a = function (_0x2f0a52) {
while (--_0x2f0a52) {
_0x1d84fe["push"](_0x1d84fe["shift"]());
}
};
_0x10a5a(++_0x3aeda0);
})(_0x53bf, 0x172);
var _0x480a = function (_0x4341e5, _0x5923b4) {
_0x4341e5 = _0x4341e5 - 0x0;
var _0xb3622e = _0x53bf[_0x4341e5];
return _0xb3622e;
};
let x = "1" + 0x1;
console[_0x480a("0x0")]("x", x);
看到了吧,那么簡單的兩行代碼,被我們混淆成了這個樣子,其實這里我們就是設定了一個「控制流平坦化」的選項。整體看來,代碼的可讀性大大降低,也大大加大了 JavaScript 調試的難度。
好,那么我們來跟著 javascript-obfuscator 走一遍,就能具體知道 JavaScript 混淆到底有多少方法了。
注意:由于這些例子中,調用 javascript-obfuscator 進行混淆的實現是一樣的,所以下文的示例只說明 code 和 options 變量的修改,完整代碼請自行補全。
這里 javascript-obfuscator 也提供了代碼壓縮的功能,使用其參數 compact 即可完成 JavaScript 代碼的壓縮,輸出為一行內容。默認是 true,如果定義為 false,則混淆后的代碼會分行顯示。
示例如下:
const code = `
let x = '1' + 1
console.log('x', x)
`;
const options = {
compact: false,
};
這里我們先把代碼壓縮 compact 選項設置為 false,運行結果如下:
let x = "1" + 0x1;
console["log"]("x", x);
如果不設置 compact 或把 compact 設置為 true,結果如下:
var _0x151c = ["log"];
(function (_0x1ce384, _0x20a7c7) {
var _0x25fc92 = function (_0x188aec) {
while (--_0x188aec) {
_0x1ce384["push"](_0x1ce384["shift"]());
}
};
_0x25fc92(++_0x20a7c7);
})(_0x151c, 0x1b7);
var _0x553e = function (_0x259219, _0x241445) {
_0x259219 = _0x259219 - 0x0;
var _0x56d72d = _0x151c[_0x259219];
return _0x56d72d;
};
let x = "1" + 0x1;
console[_0x553e("0x0")]("x", x);
可以看到單行顯示的時候,對變量名進行了進一步的混淆,這里變量的命名都變成了 16 進制形式的字符串,這是因為啟用了一些默認壓縮和混淆配置導致的。總之我們可以看到代碼的可讀性相比之前大大降低了。
變量名混淆可以通過在 javascript-obfuscator 中配置 identifierNamesGenerator 參數實現,我們通過這個參數可以控制變量名混淆的方式,如 hexadecimal 則會替換為 16 進制形式的字符串,在這里我們可以設定如下值:
該參數的值默認為 hexadecimal。
我們將該參數修改為 mangled 來試一下:
const code = `
let hello = '1' + 1
console.log('hello', hello)
`;
const options = {
compact: true,
identifierNamesGenerator: "mangled",
};
運行結果如下:
var a = ["hello"];
(function (c, d) {
var e = function (f) {
while (--f) {
c["push"](c["shift"]());
}
};
e(++d);
})(a, 0x9b);
var b = function (c, d) {
c = c - 0x0;
var e = a[c];
return e;
};
let hello = "1" + 0x1;
console["log"](b("0x0"), hello);
可以看到這里的變量命名都變成了 a、b 等形式。
如果我們將 identifierNamesGenerator 修改為 hexadecimal 或者不設置,運行結果如下:
var _0x4e98 = ["log", "hello"];
(function (_0x4464de, _0x39de6c) {
var _0xdffdda = function (_0x6a95d5) {
while (--_0x6a95d5) {
_0x4464de["push"](_0x4464de["shift"]());
}
};
_0xdffdda(++_0x39de6c);
})(_0x4e98, 0xc8);
var _0x53cb = function (_0x393bda, _0x8504e7) {
_0x393bda = _0x393bda - 0x0;
var _0x46ab80 = _0x4e98[_0x393bda];
return _0x46ab80;
};
let hello = "1" + 0x1;
console[_0x53cb("0x0")](_0x53cb("0x1"), hello);
可以看到選用了 mangled,其代碼體積會更小,但 hexadecimal 其可讀性會更低。
另外我們還可以通過設置 identifiersPrefix 參數來控制混淆后的變量前綴,示例如下:
const code = `
let hello = '1' + 1
console.log('hello', hello)
`;
const options = {
identifiersPrefix: "germey",
};
運行結果如下:
var germey_0x3dea = ["log", "hello"];
(function (_0x348ff3, _0x5330e8) {
var _0x1568b1 = function (_0x4740d8) {
while (--_0x4740d8) {
_0x348ff3["push"](_0x348ff3["shift"]());
}
};
_0x1568b1(++_0x5330e8);
})(germey_0x3dea, 0x94);
var germey_0x30e4 = function (_0x2e8f7c, _0x1066a8) {
_0x2e8f7c = _0x2e8f7c - 0x0;
var _0x5166ba = germey_0x3dea[_0x2e8f7c];
return _0x5166ba;
};
let hello = "1" + 0x1;
console[germey_0x30e4("0x0")](germey_0x30e4("0x1"), hello);
可以看到混淆后的變量前綴加上了我們自定義的字符串 germey。
另外 renameGlobals 這個參數還可以指定是否混淆全局變量和函數名稱,默認為 false。示例如下:
const code = `
var $ = function(id) {
return document.getElementById(id);
};
`;
const options = {
renameGlobals: true,
};
運行結果如下:
var _0x4864b0 = function (_0x5763be) {
return document["getElementById"](_0x5763be);
};
可以看到這里我們聲明了一個全局變量 $,在 renameGlobals 設置為 true 之后,$ 這個變量也被替換了。如果后文用到了這個 $ 對象,可能就會有找不到定義的錯誤,因此這個參數可能導致代碼執行不通。
如果我們不設置 renameGlobals 或者設置為 false,結果如下:
var _0x239a = ["getElementById"];
(function (_0x3f45a3, _0x583dfa) {
var _0x2cade2 = function (_0x28479a) {
while (--_0x28479a) {
_0x3f45a3["push"](_0x3f45a3["shift"]());
}
};
_0x2cade2(++_0x583dfa);
})(_0x239a, 0xe1);
var _0x3758 = function (_0x18659d, _0x50c21d) {
_0x18659d = _0x18659d - 0x0;
var _0x531b8d = _0x239a[_0x18659d];
return _0x531b8d;
};
var $ = function (_0x3d8723) {
return document[_0x3758("0x0")](_0x3d8723);
};
可以看到,最后還是有 $ 的聲明,其全局名稱沒有被改變。
字符串混淆,即將一個字符串聲明放到一個數組里面,使之無法被直接搜索到。我們可以通過控制 stringArray 參數來控制,默認為 true。
我們還可以通過 rotateStringArray 參數來控制數組化后結果的的元素順序,默認為 true。還可以通過 stringArrayEncoding 參數來控制數組的編碼形式,默認不開啟編碼,如果設置為 true 或 base64,則會使用 Base64 編碼,如果設置為 rc4,則使用 RC4 編碼。另外可以通過 stringArrayThreshold 來控制啟用編碼的概率,范圍 0 到 1,默認 0.8。
示例如下:
const code = `
var a = 'hello world'
`;
const options = {
stringArray: true,
rotateStringArray: true,
stringArrayEncoding: true, // 'base64' 或 'rc4' 或 false
stringArrayThreshold: 1,
};
運行結果如下:
var _0x4215 = ["aGVsbG8gd29ybGQ="];
(function (_0x42bf17, _0x4c348f) {
var _0x328832 = function (_0x355be1) {
while (--_0x355be1) {
_0x42bf17["push"](_0x42bf17["shift"]());
}
};
_0x328832(++_0x4c348f);
})(_0x4215, 0x1da);
var _0x5191 = function (_0x3cf2ba, _0x1917d8) {
_0x3cf2ba = _0x3cf2ba - 0x0;
var _0x1f93f0 = _0x4215[_0x3cf2ba];
if (_0x5191["LqbVDH"] === undefined) {
(function () {
var _0x5096b2;
try {
var _0x282db1 = Function(
"return\x20(function()\x20" +
"{}.constructor(\x22return\x20this\x22)(\x20)" +
");"
);
_0x5096b2 = _0x282db1();
} catch (_0x2acb9c) {
_0x5096b2 = window;
}
var _0x388c14 =
"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/=";
_0x5096b2["atob"] ||
(_0x5096b2["atob"] = function (_0x4cc27c) {
var _0x2af4ae = String(_0x4cc27c)["replace"](/=+$/, "");
for (
var _0x21400b = 0x0,
_0x3f4e2e,
_0x5b193b,
_0x233381 = 0x0,
_0x3dccf7 = "";
(_0x5b193b = _0x2af4ae["charAt"](_0x233381++));
~_0x5b193b &&
((_0x3f4e2e =
_0x21400b % 0x4 ? _0x3f4e2e * 0x40 + _0x5b193b : _0x5b193b),
_0x21400b++ % 0x4)
? (_0x3dccf7 += String["fromCharCode"](
0xff & (_0x3f4e2e >> ((-0x2 * _0x21400b) & 0x6))
))
: 0x0
) {
_0x5b193b = _0x388c14["indexOf"](_0x5b193b);
}
return _0x3dccf7;
});
})();
_0x5191["DuIurT"] = function (_0x51888e) {
var _0x29801f = atob(_0x51888e);
var _0x561e62 = [];
for (
var _0x5dd788 = 0x0, _0x1a8b73 = _0x29801f["length"];
_0x5dd788 < _0x1a8b73;
_0x5dd788++
) {
_0x561e62 +=
"%" +
("00" + _0x29801f["charCodeAt"](_0x5dd788)["toString"](0x10))[
"slice"
](-0x2);
}
return decodeURIComponent(_0x561e62);
};
_0x5191["mgoBRd"] = {};
_0x5191["LqbVDH"] = !![];
}
var _0x1741f0 = _0x5191["mgoBRd"][_0x3cf2ba];
if (_0x1741f0 === undefined) {
_0x1f93f0 = _0x5191["DuIurT"](_0x1f93f0);
_0x5191["mgoBRd"][_0x3cf2ba] = _0x1f93f0;
} else {
_0x1f93f0 = _0x1741f0;
}
return _0x1f93f0;
};
var a = _0x5191("0x0");
可以看到這里就把字符串進行了 Base64 編碼,我們再也無法通過查找的方式找到字符串的位置了。
如果將 stringArray 設置為 false 的話,輸出就是這樣:
var a = "hello\x20world";
字符串就仍然是明文顯示的,沒有被編碼。
另外我們還可以使用 unicodeEscapeSequence 這個參數對字符串進行 Unicode 轉碼,使之更加難以辨認,示例如下:
const code = `
var a = 'hello world'
`;
const options = {
compact: false,
unicodeEscapeSequence: true,
};
運行結果如下:
var _0x5c0d = ["\x68\x65\x6c\x6c\x6f\x20\x77\x6f\x72\x6c\x64"];
(function (_0x54cc9c, _0x57a3b2) {
var _0xf833cf = function (_0x3cd8c6) {
while (--_0x3cd8c6) {
_0x54cc9c["push"](_0x54cc9c["shift"]());
}
};
_0xf833cf(++_0x57a3b2);
})(_0x5c0d, 0x17d);
var _0x28e8 = function (_0x3fd645, _0x2cf5e7) {
_0x3fd645 = _0x3fd645 - 0x0;
var _0x298a20 = _0x5c0d[_0x3fd645];
return _0x298a20;
};
var a = _0x28e8("0x0");
可以看到,這里字符串被數字化和 Unicode 化,非常難以辨認。
在很多 JavaScript 逆向的過程中,一些關鍵的字符串可能會作為切入點來查找加密入口。用了這種混淆之后,如果有人想通過全局搜索的方式搜索 hello 這樣的字符串找加密入口,也沒法搜到了。
我們可以通過設置 selfDefending 參數來開啟代碼自我保護功能。開啟之后,混淆后的 JavaScript 會以強制一行形式顯示,如果我們將混淆后的代碼進行格式化或者重命名,該段代碼將無法執行。
示例如下:
const code = `
console.log('hello world')
`;
const options = {
selfDefending: true,
};
運行結果如下:
var _0x26da = ["log", "hello\x20world"];
(function (_0x190327, _0x57c2c0) {
var _0x577762 = function (_0xc9dabb) {
while (--_0xc9dabb) {
_0x190327["push"](_0x190327["shift"]());
}
};
var _0x35976e = function () {
var _0x16b3fe = {
data: { key: "cookie", value: "timeout" },
setCookie: function (_0x2d52d5, _0x16feda, _0x57cadf, _0x56056f) {
_0x56056f = _0x56056f || {};
var _0x5b6dc3 = _0x16feda + "=" + _0x57cadf;
var _0x333ced = 0x0;
for (
var _0x333ced = 0x0, _0x19ae36 = _0x2d52d5["length"];
_0x333ced < _0x19ae36;
_0x333ced++
) {
var _0x409587 = _0x2d52d5[_0x333ced];
_0x5b6dc3 += ";\x20" + _0x409587;
var _0x4aa006 = _0x2d52d5[_0x409587];
_0x2d52d5["push"](_0x4aa006);
_0x19ae36 = _0x2d52d5["length"];
if (_0x4aa006 !== !![]) {
_0x5b6dc3 += "=" + _0x4aa006;
}
}
_0x56056f["cookie"] = _0x5b6dc3;
},
removeCookie: function () {
return "dev";
},
getCookie: function (_0x30c497, _0x51923d) {
_0x30c497 =
_0x30c497 ||
function (_0x4b7e18) {
return _0x4b7e18;
};
var _0x557e06 = _0x30c497(
new RegExp(
"(?:^|;\x20)" +
_0x51923d["replace"](/([.$?*|{}()[]\/+^])/g, "$1") +
"=([^;]*)"
)
);
var _0x817646 = function (_0xf3fae7, _0x5d8208) {
_0xf3fae7(++_0x5d8208);
};
_0x817646(_0x577762, _0x57c2c0);
return _0x557e06 ? decodeURIComponent(_0x557e06[0x1]) : undefined;
},
};
var _0x4673cd = function () {
var _0x4c6c5c = new RegExp(
"\x5cw+\x20*\x5c(\x5c)\x20*{\x5cw+\x20*[\x27|\x22].+[\x27|\x22];?\x20*}"
);
return _0x4c6c5c["test"](_0x16b3fe["removeCookie"]["toString"]());
};
_0x16b3fe["updateCookie"] = _0x4673cd;
var _0x5baa80 = "";
var _0x1faf19 = _0x16b3fe["updateCookie"]();
if (!_0x1faf19) {
_0x16b3fe["setCookie"](["*"], "counter", 0x1);
} else if (_0x1faf19) {
_0x5baa80 = _0x16b3fe["getCookie"](null, "counter");
} else {
_0x16b3fe["removeCookie"]();
}
};
_0x35976e();
})(_0x26da, 0x140);
var _0x4391 = function (_0x1b42d8, _0x57edc8) {
_0x1b42d8 = _0x1b42d8 - 0x0;
var _0x2fbeca = _0x26da[_0x1b42d8];
return _0x2fbeca;
};
var _0x197926 = (function () {
var _0x10598f = !![];
return function (_0xffa3b3, _0x7a40f9) {
var _0x48e571 = _0x10598f
? function () {
if (_0x7a40f9) {
var _0x2194b5 = _0x7a40f9["apply"](_0xffa3b3, arguments);
_0x7a40f9 = null;
return _0x2194b5;
}
}
: function () {};
_0x10598f = ![];
return _0x48e571;
};
})();
var _0x2c6fd7 = _0x197926(this, function () {
var _0x4828bb = function () {
return "\x64\x65\x76";
},
_0x35c3bc = function () {
return "\x77\x69\x6e\x64\x6f\x77";
};
var _0x456070 = function () {
var _0x4576a4 = new RegExp(
"\x5c\x77\x2b\x20\x2a\x5c\x28\x5c\x29\x20\x2a\x7b\x5c\x77\x2b\x20\x2a\x5b\x27\x7c\x22\x5d\x2e\x2b\x5b\x27\x7c\x22\x5d\x3b\x3f\x20\x2a\x7d"
);
return !_0x4576a4["\x74\x65\x73\x74"](
_0x4828bb["\x74\x6f\x53\x74\x72\x69\x6e\x67"]()
);
};
var _0x3fde69 = function () {
var _0xabb6f4 = new RegExp(
"\x28\x5c\x5c\x5b\x78\x7c\x75\x5d\x28\x5c\x77\x29\x7b\x32\x2c\x34\x7d\x29\x2b"
);
return _0xabb6f4["\x74\x65\x73\x74"](
_0x35c3bc["\x74\x6f\x53\x74\x72\x69\x6e\x67"]()
);
};
var _0x2d9a50 = function (_0x58fdb4) {
var _0x2a6361 = ~-0x1 >> (0x1 + (0xff % 0x0));
if (_0x58fdb4["\x69\x6e\x64\x65\x78\x4f\x66"]("\x69" === _0x2a6361)) {
_0xc388c5(_0x58fdb4);
}
};
var _0xc388c5 = function (_0x2073d6) {
var _0x6bb49f = ~-0x4 >> (0x1 + (0xff % 0x0));
if (
_0x2073d6["\x69\x6e\x64\x65\x78\x4f\x66"]((!![] + "")[0x3]) !== _0x6bb49f
) {
_0x2d9a50(_0x2073d6);
}
};
if (!_0x456070()) {
if (!_0x3fde69()) {
_0x2d9a50("\x69\x6e\x64\u0435\x78\x4f\x66");
} else {
_0x2d9a50("\x69\x6e\x64\x65\x78\x4f\x66");
}
} else {
_0x2d9a50("\x69\x6e\x64\u0435\x78\x4f\x66");
}
});
_0x2c6fd7();
console[_0x4391("0x0")](_0x4391("0x1"));
如果我們將上述代碼放到控制臺,它的執行結果和之前是一模一樣的,沒有任何問題。
如果我們將其進行格式化,然后貼到到瀏覽器控制臺里面,瀏覽器會直接卡死無法運行。這樣如果有人對代碼進行了格式化,就無法正常對代碼進行運行和調試,從而起到了保護作用。
控制流平坦化其實就是將代碼的執行邏輯混淆,使其變得復雜難讀。其基本思想是將一些邏輯處理塊都統一加上一個前驅邏輯塊,每個邏輯塊都由前驅邏輯塊進行條件判斷和分發,構成一個個閉環邏輯,導致整個執行邏輯十分復雜難讀。
比如說這里有一段示例代碼:
console.log(c);
console.log(a);
console.log(b);
代碼邏輯一目了然,依次在控制臺輸出了 c、a、b 三個變量的值,但如果把這段代碼進行控制流平坦化處理后,代碼就會變成這樣:
const s = "3|1|2".split("|");
let x = 0;
while (true) {
switch (s[x++]) {
case "1":
console.log(a);
continue;
case "2":
console.log(b);
continue;
case "3":
console.log(c);
continue;
}
break;
}
可以看到,混淆后的代碼首先聲明了一個變量 s,它的結果是一個列表,其實是 ["3", "1", "2"],然后下面通過 switch 語句對 s 中的元素進行了判斷,每個 case 都加上了各自的代碼邏輯。通過這樣的處理,一些連續的執行邏輯就被打破了,代碼被修改為一個 switch 語句,原本我們可以一眼看出的邏輯是控制臺先輸出 c,然后才是 a、b,但是現在我們必須要結合 switch 的判斷條件和對應 case 的內容進行判斷,我們很難再一眼每條語句的執行順序了,這就大大降低了代碼的可讀性。
在 javascript-obfuscator 中我們通過 controlFlowFlattening 變量可以控制是否開啟控制流平坦化,示例如下:
const options = {
compact: false,
controlFlowFlattening: true,
};
使用控制流平坦化可以使得執行邏輯更加復雜難讀,目前非常多的前端混淆都會加上這個選項。但啟用控制流平坦化之后,代碼的執行時間會變長,最長達 1.5 倍之多。
另外我們還能使用 controlFlowFlatteningThreshold 這個參數來控制比例,取值范圍是 0 到 1,默認 0.75,如果設置為 0,那相當于 controlFlowFlattening 設置為 false,即不開啟控制流扁平化 。
無用代碼即不會被執行的代碼或對上下文沒有任何影響的代碼,注入之后可以對現有的 JavaScript 代碼的閱讀形成干擾。我們可以使用 deadCodeInjection 參數開啟這個選項,默認為 false。
比如這里有一段代碼:
const a = function () {
console.log("hello world");
};
const b = function () {
console.log("nice to meet you");
};
a();
b();
這里就聲明了方法 a 和 b,然后依次進行調用,分別輸出兩句話。
但經過無用代碼注入處理之后,代碼就會變成類似這樣的結果:
const _0x16c18d = function () {
if (!![[]]) {
console.log("hello world");
} else {
console.log("this");
console.log("is");
console.log("dead");
console.log("code");
}
};
const _0x1f7292 = function () {
if ("xmv2nOdfy2N".charAt(4) !== String.fromCharCode(110)) {
console.log("this");
console.log("is");
console.log("dead");
console.log("code");
} else {
console.log("nice to meet you");
}
};
_0x16c18d();
_0x1f7292();
可以看到,每個方法內部都增加了額外的 if else 語句,其中 if 的判斷條件還是一個表達式,其結果是 true 還是 false 我們還不太一眼能看出來,比如說 _0x1f7292 這個方法,它的 if 判斷條件是:
"xmv2nOdfy2N".charAt(4) !== String.fromCharCode(110)
在不等號前面其實是從字符串中取出指定位置的字符,不等號后面則調用了 fromCharCode 方法來根據 ascii 碼轉換得到一個字符,然后比較兩個字符的結果是否是不一樣的。前者經過我們推算可以知道結果是 n,但對于后者,多數情況下我們還得去查一下 ascii 碼表才能知道其結果也是 n,最后兩個結果是相同的,所以整個表達式的結果是 false,所以 if 后面跟的邏輯實際上就是不會被執行到的無用代碼,但這些代碼對我們閱讀代碼起到了一定的干擾作用。
因此,這種混淆方式通過混入一些特殊的判斷條件并加入一些不會被執行的代碼,可以對代碼起到一定的混淆干擾作用。
在 javascript-obfuscator 中,我們可以通過 deadCodeInjection 參數控制無用代碼的注入,配置如下:
const options = {
compact: false,
deadCodeInjection: true,
};
另外我們還可以通過設置 deadCodeInjectionThreshold 參數來控制無用代碼注入的比例,取值 0 到 1,默認是 0.4。
如果是一個對象,可以使用 transformObjectKeys 來對對象的鍵值進行替換,示例如下:
const code = `
(function(){
var object = {
foo: 'test1',
bar: {
baz: 'test2'
}
};
})();
`;
const options = {
compact: false,
transformObjectKeys: true,
};
輸出結果如下:
var _0x7a5d = ["bar", "test2", "test1"];
(function (_0x59fec5, _0x2e4fac) {
var _0x231e7a = function (_0x46f33e) {
while (--_0x46f33e) {
_0x59fec5["push"](_0x59fec5["shift"]());
}
};
_0x231e7a(++_0x2e4fac);
})(_0x7a5d, 0x167);
var _0x3bc4 = function (_0x309ad3, _0x22d5ac) {
_0x309ad3 = _0x309ad3 - 0x0;
var _0x3a034e = _0x7a5d[_0x309ad3];
return _0x3a034e;
};
(function () {
var _0x9f1fd1 = {};
_0x9f1fd1["foo"] = _0x3bc4("0x0");
_0x9f1fd1[_0x3bc4("0x1")] = {};
_0x9f1fd1[_0x3bc4("0x1")]["baz"] = _0x3bc4("0x2");
})();
可以看到,Object 的變量名被替換為了特殊的變量,使得可讀性變差,這樣我們就不好直接通過變量名進行搜尋了,這也可以起到一定的防護作用。
可以使用 disableConsoleOutput 來禁用掉 console.log 輸出功能,加大調試難度,示例如下:
const code = `
console.log('hello world')
`;
const options = {
disableConsoleOutput: true,
};
運行結果如下:
var _0x3a39 = [
"debug",
"info",
"error",
"exception",
"trace",
"hello\x20world",
"apply",
"{}.constructor(\x22return\x20this\x22)(\x20)",
"console",
"log",
"warn",
];
(function (_0x2a157a, _0x5d9d3b) {
var _0x488e2c = function (_0x5bcb73) {
while (--_0x5bcb73) {
_0x2a157a["push"](_0x2a157a["shift"]());
}
};
_0x488e2c(++_0x5d9d3b);
})(_0x3a39, 0x10e);
var _0x5bff = function (_0x43bdfc, _0x52e4c6) {
_0x43bdfc = _0x43bdfc - 0x0;
var _0xb67384 = _0x3a39[_0x43bdfc];
return _0xb67384;
};
var _0x349b01 = (function () {
var _0x1f484b = !![];
return function (_0x5efe0d, _0x33db62) {
var _0x20bcd2 = _0x1f484b
? function () {
if (_0x33db62) {
var _0x77054c = _0x33db62[_0x5bff("0x0")](_0x5efe0d, arguments);
_0x33db62 = null;
return _0x77054c;
}
}
: function () {};
_0x1f484b = ![];
return _0x20bcd2;
};
})();
var _0x19f538 = _0x349b01(this, function () {
var _0x7ab6e4 = function () {};
var _0x157bff;
try {
var _0x5e672c = Function(
"return\x20(function()\x20" + _0x5bff("0x1") + ");"
);
_0x157bff = _0x5e672c();
} catch (_0x11028d) {
_0x157bff = window;
}
if (!_0x157bff[_0x5bff("0x2")]) {
_0x157bff[_0x5bff("0x2")] = (function (_0x7ab6e4) {
var _0x5a8d9e = {};
_0x5a8d9e[_0x5bff("0x3")] = _0x7ab6e4;
_0x5a8d9e[_0x5bff("0x4")] = _0x7ab6e4;
_0x5a8d9e[_0x5bff("0x5")] = _0x7ab6e4;
_0x5a8d9e[_0x5bff("0x6")] = _0x7ab6e4;
_0x5a8d9e[_0x5bff("0x7")] = _0x7ab6e4;
_0x5a8d9e[_0x5bff("0x8")] = _0x7ab6e4;
_0x5a8d9e[_0x5bff("0x9")] = _0x7ab6e4;
return _0x5a8d9e;
})(_0x7ab6e4);
} else {
_0x157bff[_0x5bff("0x2")][_0x5bff("0x3")] = _0x7ab6e4;
_0x157bff[_0x5bff("0x2")][_0x5bff("0x4")] = _0x7ab6e4;
_0x157bff[_0x5bff("0x2")]["debug"] = _0x7ab6e4;
_0x157bff[_0x5bff("0x2")][_0x5bff("0x6")] = _0x7ab6e4;
_0x157bff[_0x5bff("0x2")][_0x5bff("0x7")] = _0x7ab6e4;
_0x157bff[_0x5bff("0x2")][_0x5bff("0x8")] = _0x7ab6e4;
_0x157bff[_0x5bff("0x2")][_0x5bff("0x9")] = _0x7ab6e4;
}
});
_0x19f538();
console[_0x5bff("0x3")](_0x5bff("0xa"));
此時,我們如果執行這個代碼,發現是沒有任何輸出的,這里實際上就是將 console 的一些功能禁用了。
我們知道,在 JavaScript 代碼中如果加入 debugger 這個關鍵字,那么在執行到該位置的時候控制它就會進入斷點調試模式。如果在代碼多個位置都加入 debugger 這個關鍵字,或者定義某個邏輯來反復執行 debugger,那就會不斷進入斷點調試模式,原本的代碼無法就無法順暢地執行了。這個過程可以稱為調試保護,即通過反復執行 debugger 來使得原來的代碼無法順暢執行。
其效果類似于執行了如下代碼:
setInterval(() => {
debugger;
}, 3000);
如果我們把這段代碼粘貼到控制臺,它就會反復地執行 debugger 語句進入斷點調試模式,從而干擾正常的調試流程。
在 javascript-obfuscator 中可以使用 debugProtection 來啟用調試保護機制,還可以使用 debugProtectionInterval 來啟用無限 Debug ,使得代碼在調試過程中會不斷進入斷點模式,無法順暢執行,配置如下:
const options = {
debugProtection: true,
debugProtectionInterval: true,
};
混淆后的代碼會不斷跳到 debugger 代碼的位置,使得整個代碼無法順暢執行,對 JavaScript 代碼的調試形成一定的干擾。
我們還可以通過控制 domainLock 來控制 JavaScript 代碼只能在特定域名下運行,這樣就可以降低代碼被模擬或盜用的風險。
示例如下:
const code = `
console.log('hello world')
`;
const options = {
domainLock: ["cuiqingcai.com"],
};
這里我們使用了 domainLock 指定了一個域名叫做 cuiqingcai.com,也就是設置了一個域名白名單,混淆后的代碼結果如下:
var _0x3203 = [
"apply",
"return\x20(function()\x20",
"{}.constructor(\x22return\x20this\x22)(\x20)",
"item",
"attribute",
"value",
"replace",
"length",
"charCodeAt",
"log",
"hello\x20world",
];
(function (_0x2ed22c, _0x3ad370) {
var _0x49dc54 = function (_0x53a786) {
while (--_0x53a786) {
_0x2ed22c["push"](_0x2ed22c["shift"]());
}
};
_0x49dc54(++_0x3ad370);
})(_0x3203, 0x155);
var _0x5b38 = function (_0xd7780b, _0x19c0f2) {
_0xd7780b = _0xd7780b - 0x0;
var _0x2d2f44 = _0x3203[_0xd7780b];
return _0x2d2f44;
};
var _0x485919 = (function () {
var _0x5cf798 = !![];
return function (_0xd1fa29, _0x2ed646) {
var _0x56abf = _0x5cf798
? function () {
if (_0x2ed646) {
var _0x33af63 = _0x2ed646[_0x5b38("0x0")](_0xd1fa29, arguments);
_0x2ed646 = null;
return _0x33af63;
}
}
: function () {};
_0x5cf798 = ![];
return _0x56abf;
};
})();
var _0x67dcc8 = _0x485919(this, function () {
var _0x276a31;
try {
var _0x5c8be2 = Function(_0x5b38("0x1") + _0x5b38("0x2") + ");");
_0x276a31 = _0x5c8be2();
} catch (_0x5f1c00) {
_0x276a31 = window;
}
var _0x254a0d = function () {
return {
key: _0x5b38("0x3"),
value: _0x5b38("0x4"),
getAttribute: (function () {
for (var _0x5cc3c7 = 0x0; _0x5cc3c7 < 0x3e8; _0x5cc3c7--) {
var _0x35b30b = _0x5cc3c7 > 0x0;
switch (_0x35b30b) {
case !![]:
return (
this[_0x5b38("0x3")] +
"_" +
this[_0x5b38("0x5")] +
"_" +
_0x5cc3c7
);
default:
this[_0x5b38("0x3")] + "_" + this[_0x5b38("0x5")];
}
}
})(),
};
};
var _0x3b375a = new RegExp("[QLCIKYkCFzdWpzRAXMhxJOYpTpYWJHPll]", "g");
var _0x5a94d2 = "cuQLiqiCInKYkgCFzdWcpzRAaXMi.hcoxmJOYpTpYWJHPll"
[_0x5b38("0x6")](_0x3b375a, "")
["split"](";");
var _0x5c0da2;
var _0x19ad5d;
var _0x5992ca;
var _0x40bd39;
for (var _0x5cad1 in _0x276a31) {
if (
_0x5cad1[_0x5b38("0x7")] == 0x8 &&
_0x5cad1[_0x5b38("0x8")](0x7) == 0x74 &&
_0x5cad1[_0x5b38("0x8")](0x5) == 0x65 &&
_0x5cad1[_0x5b38("0x8")](0x3) == 0x75 &&
_0x5cad1[_0x5b38("0x8")](0x0) == 0x64
) {
_0x5c0da2 = _0x5cad1;
break;
}
}
for (var _0x29551 in _0x276a31[_0x5c0da2]) {
if (
_0x29551[_0x5b38("0x7")] == 0x6 &&
_0x29551[_0x5b38("0x8")](0x5) == 0x6e &&
_0x29551[_0x5b38("0x8")](0x0) == 0x64
) {
_0x19ad5d = _0x29551;
break;
}
}
if (!("~" > _0x19ad5d)) {
for (var _0x2b71bd in _0x276a31[_0x5c0da2]) {
if (
_0x2b71bd[_0x5b38("0x7")] == 0x8 &&
_0x2b71bd[_0x5b38("0x8")](0x7) == 0x6e &&
_0x2b71bd[_0x5b38("0x8")](0x0) == 0x6c
) {
_0x5992ca = _0x2b71bd;
break;
}
}
for (var _0x397f55 in _0x276a31[_0x5c0da2][_0x5992ca]) {
if (
_0x397f55["length"] == 0x8 &&
_0x397f55[_0x5b38("0x8")](0x7) == 0x65 &&
_0x397f55[_0x5b38("0x8")](0x0) == 0x68
) {
_0x40bd39 = _0x397f55;
break;
}
}
}
if (!_0x5c0da2 || !_0x276a31[_0x5c0da2]) {
return;
}
var _0x5f19be = _0x276a31[_0x5c0da2][_0x19ad5d];
var _0x674f76 =
!!_0x276a31[_0x5c0da2][_0x5992ca] &&
_0x276a31[_0x5c0da2][_0x5992ca][_0x40bd39];
var _0x5e1b34 = _0x5f19be || _0x674f76;
if (!_0x5e1b34) {
return;
}
var _0x593394 = ![];
for (var _0x479239 = 0x0; _0x479239 < _0x5a94d2["length"]; _0x479239++) {
var _0x19ad5d = _0x5a94d2[_0x479239];
var _0x112c24 = _0x5e1b34["length"] - _0x19ad5d["length"];
var _0x51731c = _0x5e1b34["indexOf"](_0x19ad5d, _0x112c24);
var _0x173191 = _0x51731c !== -0x1 && _0x51731c === _0x112c24;
if (_0x173191) {
if (
_0x5e1b34["length"] == _0x19ad5d[_0x5b38("0x7")] ||
_0x19ad5d["indexOf"](".") === 0x0
) {
_0x593394 = !![];
}
}
}
if (!_0x593394) {
data;
} else {
return;
}
_0x254a0d();
});
_0x67dcc8();
console[_0x5b38("0x9")](_0x5b38("0xa"));
這段代碼就只能在指定域名 cuiqingcai.com 下運行,不能在其他網站運行。這樣的話,如果一些相關 JavaScript 代碼被單獨剝離出來,想在其他網站運行或者使用程序模擬運行的話,運行結果只有是失敗,這樣就可以有效降低被代碼被模擬或盜用的風險。
另外還有一些特殊的工具包,如使用 aaencode、jjencode、jsfuck 等工具對代碼進行混淆和編碼。
示例如下:
var a = 1
jsfuck 的結果:
[][(![]+[])[!+[]+!![]+!![]]+([]+{})[+!![]]+(!![]+[])[+!![]]+(!![]+[])[+[]]][([]+{})[!+[]+!![]+!![]+!![]+!![]]+([]+{})[+!![]]+([][[]]+[])[+!![]]+(![]+[])[!+[]+!![]+!![]]+(!![]+[])[+[]]+(!![]+[])[+!![]]+([][[]]+[])[+[]]+([]+{})[!+[]+!![]+!![]+!![]+!![]]+(!![]+[])[+[]]+([]+{})[+!![]]+(!![]+[])[+!![]]]([][(![]+[])[!+[]+!![]+!![]]+([]+{})[+!![]]+(!![]+[])[+!![]]+(!![]+[])[+[]]][([]+{})[!+[]+!![]+!![]+!![]+!![]]+([]+{})[+!![]]+([][[]]+[])[+!![]]+
...
([]+{})[+!![]]+(!![]+[])[+!![]]]((!![]+[])[+!![]]+([][[]]+[])[!+[]+!![]+!![]]+(!![]+[])[+[]]+([][[]]+[])[+[]]+(!![]+[])[+!![]]+([][[]]+[])[+!![]]+([]+{})[!+[]+!![]+!![]+!![]+!![]+!![]+!![]]+(![]+[])[!+[]+!![]]+([]+{})[+!![]]+([]+{})[!+[]+!![]+!![]+!![]+!![]]+(+{}+[])[+!![]]+(!![]+[])[+[]]+([][[]]+[])[!+[]+!![]+!![]+!![]+!![]]+([]+{})[+!![]]+([][[]]+[])[+!![]])(!+[]+!![]+!![]+!![]+!![]))[!+[]+!![]+!![]]+([][[]]+[])[!+[]+!![]+!![]])(!+[]+!![]+!![]+!![]+!![])(([]+{})[+[]])[+[]]+(!+[]+!![]+!![]+[])+([][[]]+[])[!+[]+!![]])+([]+{})[!+[]+!![]+!![]+!![]+!![]+!![]+!![]]+(+!![]+[]))(!+[]+!![]+!![]+!![]+!![]+!![]+!![]+!![])
aaencode 的結果:
?ω??= /`m′)? ~┻━┻ / ['_']; o=(???) =_=3; c=(?Θ?) =(???)-(???); (?Д?) =(?Θ?)= (o^_^o)/ (o^_^o);(?Д?)={?Θ?: '_' ,?ω?? : ((?ω??==3) +'_') [?Θ?] ,???? :(?ω??+ '_')[o^_^o -(?Θ?)] ,?Д??:((???==3) +'_')[???] }; (?Д?) [?Θ?] =((?ω??==3) +'_') [c^_^o];(?Д?) ['c'] = ((?Д?)+'_') [ (???)+(???)-(?Θ?) ];(?Д?) ['o'] = ((?Д?)+'_') [?Θ?];(?o?)=(?Д?) ['c']+(?Д?) ['o']+(?ω?? +'_')[?Θ?]+ ((?ω??==3) +'_') [???] + ((?Д?) +'_') [(???)+(???)]+ ((???==3) +'_') [?Θ?]+((???==3) +'_') [(???) - (?Θ?)]+(?Д?) ['c']+((?Д?)+'_') [(???)+(???)]+ (?Д?) ['o']+((???==3) +'_') [?Θ?];(?Д?) ['_'] =(o^_^o) [?o?] [?o?];(?ε?)=((???==3) +'_') [?Θ?]+ (?Д?) .?Д??+((?Д?)+'_') [(???) + (???)]+((???==3) +'_') [o^_^o -?Θ?]+((???==3) +'_') [?Θ?]+ (?ω?? +'_') [?Θ?]; (???)+=(?Θ?); (?Д?)[?ε?]='\'; (?Д?).?Θ??=(?Д?+ ???)[o^_^o -(?Θ?)];(o???o)=(?ω?? +'_')[c^_^o];(?Д?) [?o?]='\"';(?Д?) ['_'] ( (?Д?) ['_'] (?ε?+(?Д?)[?o?]+ (?Д?)[?ε?]+(?Θ?)+ ((o^_^o) +(o^_^o))+ ((o^_^o) +(o^_^o))+ (?Д?)[?ε?]+(?Θ?)+ (???)+ (?Θ?)+ (?Д?)[?ε?]+(?Θ?)+ ((o^_^o) +(o^_^o))+ ((o^_^o) - (?Θ?))+ (?Д?)[?ε?]+(???)+ (c^_^o)+ (?Д?)[?ε?]+(?Θ?)+ (???)+ (?Θ?)+ (?Д?)[?ε?]+(???)+ (c^_^o)+ (?Д?)[?ε?]+((???) + (o^_^o))+ ((???) + (?Θ?))+ (?Д?)[?ε?]+(???)+ (c^_^o)+ (?Д?)[?ε?]+((o^_^o) +(o^_^o))+ (?Θ?)+ (?Д?)[?o?])(?Θ?))((?Θ?)+(?Д?)[?ε?]+((???)+(?Θ?))+(?Θ?)+(?Д?)[?o?]);
jjencode 的結果:
$=~[];$={___:++$,$$$$:(![]+"")[$],__$:++$,$_$_:(![]+"")[$],_$_:++$,$_$$:({}+"")[$],$$_$:($[$]+"")[$],_$$:++$,$$$_:(!""+"")[$],$__:++$,$_$:++$,$$__:({}+"")[$],$$_:++$,$$$:++$,$___:++$,$__$:++$};$.$_=($.$_=$+"")[$.$_$]+($._$=$.$_[$.__$])+($.$$=($.$+"")[$.__$])+((!$)+"")[$._$$]+($.__=$.$_[$.$$_])+($.$=(!""+"")[$.__$])+($._=(!""+"")[$._$_])+$.$_[$.$_$]+$.__+$._$+$.$;$.$$=$.$+(!""+"")[$._$$]+$.__+$._+$.$+$.$$;$.$=($.___)[$.$_][$.$_];$.$($.$($.$$+"\""+"\"+$.__$+$.$$_+$.$$_+$.$_$_+"\"+$.__$+$.$$_+$._$_+"\"+$.$__+$.___+$.$_$_+"\"+$.$__+$.___+"=\"+$.$__+$.___+$.__$+"\"")())();
可以看到,通過這些工具,原本非常簡單的代碼被轉化為一些幾乎完全不可讀的代碼,但實際上運行效果還是相同的。這些混淆方式比較另類,看起來雖然沒有什么頭緒,但實際上找到規律是非常好還原的,其沒有真正達到強力混淆的效果。
以上便是對 JavaScript 混淆方式的介紹和總結。總的來說,經過混淆的 JavaScript 代碼其可讀性大大降低,同時防護效果也大大增強。
隨著技術的發展,WebAssembly 逐漸流行起來。不同于 JavaScript 混淆技術, WebAssembly 其基本思路是將一些核心邏輯使用其他語言(如 C/C++ 語言)來編寫,并編譯成類似字節碼的文件,并通過 JavaScript 調用執行,從而起到二進制級別的防護作用。
WebAssembly 是一種可以使用非 JavaScript 編程語言編寫代碼并且能在瀏覽器上運行的技術方案,比如借助于我們能將 C/C++ 利用 Emscripten 編譯工具轉成 wasm 格式的文件, JavaScript 可以直接調用該文件執行其中的方法。
WebAssembly 是經過編譯器編譯之后的字節碼,可以從 C/C++ 編譯而來,得到的字節碼具有和 JavaScript 相同的功能,運行速度更快,體積更小,而且在語法上完全脫離 JavaScript,同時具有沙盒化的執行環境。
比如這就是一個基本的 WebAssembly 示例:
WebAssembly.compile(
new Uint8Array(
`
00 61 73 6d 01 00 00 00 01 0c 02 60 02 7f 7f 01
7f 60 01 7f 01 7f 03 03 02 00 01 07 10 02 03 61
64 64 00 00 06 73 71 75 61 72 65 00 01 0a 13 02
08 00 20 00 20 01 6a 0f 0b 08 00 20 00 20 00 6c
0f 0b`
.trim()
.split(/[\s\r\n]+/g)
.map((str) => parseInt(str, 16))
)
).then((module) => {
const instance = new WebAssembly.Instance(module);
const { add, square } = instance.exports;
console.log("2 + 4 =", add(2, 4));
console.log("3^2 =", square(3));
console.log("(2 + 5)^2 =", square(add(2 + 5)));
});
這里其實是利用 WebAssembly 定義了兩個方法,分別是 add 和 square,可以分別用于求和和開平方計算。那這兩個方法在哪里聲明的呢?其實它們被隱藏在了一個 Uint8Array 里面,僅僅查看明文代碼我們確實無從知曉里面究竟定義了什么邏輯,但確實是可以執行的,我們將這段代碼輸入到瀏覽器控制臺下,運行結果如下:
2 + 4 = 6
3^2 = 9
(2 + 5)^2 = 49
由此可見,通過 WebAssembly 我們可以成功將核心邏輯“隱藏”起來,這樣某些核心邏輯就不能被輕易找出來了。
所以,很多網站越來越多使用 WebAssembly 技術來保護一些核心邏輯不被輕易被人識別或破解,可以起到更好的防護效果。
以上,我們就介紹了接口加密技術和 JavaScript 的壓縮、混淆技術,也對 WebAssembly 技術有了初步的了解,知己知彼方能百戰不殆,了解了原理,我們才能更好地去實現 JavaScript 的逆向。
本節代碼:https://github.com/Python3WebSpider/JavaScriptObfuscate。
由于本節涉及一些專業名詞,部分內容參考來源如下:
*請認真填寫需求信息,我們會在24小時內與您取得聯系。